分享

国产版ChatGPT大盘点

本帖最后由 levycui 于 2023-4-11 19:56 编辑
问题导读:
1、国产大规模模型发布公司有哪些?
2、国产大规模模型各自的
基础技术有哪些?
3、盘古“NLP大模型”是什么?
4、中国版ChatGPT的困境是什么?


3月16日,百度发布类ChatGPT产品「文心一言」,并开放测试。

3月29日,周鸿祎在某大会上,演示360版的ChatGPT产品。

4月7日,阿里版ChatGPT产品「通义千语」并开启内测邀请。

4月9日,360的大预言模型「360智脑」开放预约,即将在4月16日开放测试。

不仅如此,4月、5月还有不少AI大厂,要发布自己的大语言模型产品。

2023-04-11_194433.jpg

我们看到,最近,国内大厂开始密集发布类ChatGPT产品。

一方面,是因为这是最近10年最大的趋势和机会。

另一方面,国内的AI,不能别国外卡了脖子。

那在类ChatGPT赛道上,哪些中国版的ChatGPT能快速顶上?都各有哪些困境需要突破呢?本文给诸位带来各个玩家的最新进展。


1、百度:文心一言

3月16日,百度正式推出国内首款生成式AI产品“文心一言”,可支持文学创作、文案创作、数理推算、多模态生成等功能。
2023-04-11_194513.jpg

“文心一言”基于全栈自研的AI基础设施进行学习和训练:
①文心知识增强大模型:“文心一言”的模型层核心能力,该产品主要采用ERNIE系列文心NLP模型,拥有千亿参数级别的ERNIE 3.0 Zeus为该系列最新模型,进一步提升了模型 对于不同下游任务的建模能力,大大拓宽了“文心一言”的应用场景。

②飞桨深度学习平台:“文心一言”的框架层核心能力,系业内首个动静统一的框架、首个 通用异构参数服务器架构,支持端边云多硬件和多操作系统,为文心大模型提供有效、快捷、完整的训练框架。

③昆仑芯2代AI芯片:“文心一言”的芯片层核心能力,采用自研XPU-R架构,通用性和性能显著提升;256 TOPS@INT8和128 TFLOPS@FP16的算力水平,较一代提升2-3倍, 保障“文心一言”算力需求。  

文心一言是国内关注度极高的首款类ChatGPT产品,一经发布便涌入了大量的用户。虽然百度创始人李彦宏坦诚:文心一言并不完美,大开脑洞的文生图也一度引起了大众热议。

此外,百度还推出了企业级大模型服务平台“文心千帆”,不仅包括文心一言,还包括百度全套文心大模型、相应的开发工具链。未来,文心千帆还会支持第三方的开源大模型。


2、腾讯:混元

3月30日,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生向媒体表示,腾讯正在研发类ChatGPT聊天机器人。对于腾讯的聊天机器人是集成到QQ、微信,还是通过腾讯云向B端用户服务,汤道生说:“都会有。”

腾讯在大模型领域的布局早已有之,其“混元”系列AI大模型覆盖了NLP、CV、多模态等基础大模型以及众多行业/领域大模型。这成为了腾讯构建类ChatGPT产品的坚实技术储备。

2022年5月,腾讯混元AI大模型在CLUE总排行榜、阅读理解、大规模知识图谱三个榜单同时登顶,一举打破三项纪录。

目前,混元AI大模型已经广泛应用于腾讯微信搜索、腾讯广告等业务场景,提升了搜索体验和广告推荐精准度。

据报道,腾讯针对ChatGPT对话式产品成立了“混元助手(HunyuanAide)”项目组,由腾讯首席科学家、腾讯AI Lab及Robotics X实验室主任张正友博士负责。

根据最新的腾讯内部学习会议内容:

1、在大模型进展方面:腾讯AI大模型六个BG都有参与,其中TEG(技术工程事业群)在算法上更偏整体,其他BG更偏行业。
2、在水平方面:其万亿参数的水平,相比ChatGPT性能更强,但可能比GPT4比有所不足。混元大模型目前偏自然语言,而GPT4支持多模态。
3、在前景方面:后续在商业化推进中,大模型可能会接入微信、游戏、短视频、广告、TOB端等业务。

在全球范围内,腾讯与谷歌、OpenAI等巨头相比,在大语言模型AI的技术研究和应用上仍存在差距。不过,凭借庞大的用户基数、多元化的业务布局以及强大的技术实力,腾讯在大语言模型AI的发展中仍具有其独特的竞争优势。

不久前腾讯发布财报后,腾讯总裁刘炽平也透露了腾讯聊天机器人的计划,“不急于求成,先打好基础,再追求新进展,我们的第一款产品将会是多次迭代之后的产品,整个过程将是长期的”。


3、阿里:通义千言


4月7日,阿里版ChatGPT产品「通义千语」并开启内测邀请。
2023-04-11_194558.jpg

早在2月8日,阿里巴巴内部一款标名“预发布”的应用被“打码”曝光,被认为是达摩院版的ChatGPT新品。从曝光截图来看,阿里巴巴可能将AI大模型技术与钉钉生产力工具深度结合。

2023-04-11_194653.jpg


此外,这款传说中的产品可以实现的功能不止于知识回答,还包括AI绘画、代码生成、小说续写、文案撰写、写诗作词。

媒体向阿里巴巴内部人士证实,目前公司确实在研发相关产品,并已经处于内测阶段。据透露,目前该款产品的命名还没有最终确定。

早在2022年9月,达摩院曾发布过“通义”大模型系列。据透露,阿里版ChatGPT,正是基于通义大模型体系进行融合升级。

据报道,推出的通义大模型底座基于统一学习范式OFA等底层技术打造,具备了能搞定多种任务的“大一统”能力:不引入新增结构,单一模型即可同时处理图像描述、视觉定位、文生图、视觉蕴含、文档摘要等10余项单模态和跨模态任务。升级后,更是可以处理超过包括语音和动作在内的30多种跨模态任务。

但据知情人士透露,打造中文ChatGPT的生态,这个定义对于阿里来说可能窄了一点。相比之下,阿里更希望能引领中文大模型的发展趋势。


4、字节:组建大模型团队

2月23日,从多个独立信源处获悉,字节跳动在大模型上已有所布局,分别在语言和图像两种模态上发力。

字节跳动相关技术负责人对此回应:技术中台在这些领域有探索,还很初期,不成熟。

一名知情人士透露,语言大模型团队由字节搜索部门牵头,目前团队规模在十数人左右。

图片大模型团队则由产品研发与工程架构部下属的智能创作团队牵头。

值得注意的是,字节跳动有不少AI产品,比如:剪映,就是一款视频智能生成工具。


5、京东:ChatJD

2月10日,京东云官微发布,京东云将推出“产业版”ChatGPT,产品名字叫:ChatJD。并公布ChatJD的落地应用路线图“125”计划。

· 1个平台:ChatJD智能人机对话平台
· 2个领域:零售、金融
· 5个应用:内容生成、人机对话、用户意图理解、信息抽取、情感分类

2023-04-11_194735.jpg

6、华为:盘古

华为近日宣布,4月8日将推出其最新的盘古大模型4,称“将是超过任何其他类似应用的最先进、最强大的自然语言处理应用”。

根据华为云官网显示,华为即将上线的“盘古系列AI大模型”分别为:NLP大模型、CV大模型、以及科学计算大模型。

其中,盘古“NLP大模型”是被认为最接近人类中文理解能力的AI大模型,而盘古“CV大模型”首次兼顾了图像判别与生成能力。


01 大模型规模

华为盘古大模型的规模相对较小,仅拥有1200亿个参数;而GPT-3则有1750亿个参数,是目前最大的自然语言处理模型。因此,在某些任务上,GPT-3可能在表现上更为突出。


02 训练数据

虽然盘古模型拥有的参数少于GPT-3,但是华为在训练时使用了大量的中文文本,包括不同类型的文本数据,如百科、新闻、小说、行业专业文本等。这种多样性的数据来源使得盘古模型拥有更广泛的知识和语言能力,对于中文应用来说具有很大的优势。


03 模型用途

华为盘古大模型主要应用于中文的文本生成、问答、翻译等任务。而GPT-3则可以应用于英文和其他语言的文本生成、翻译、自然语言推理、问题回答等任务。由于应用领域不同,两者在某些任务上的效果也有所不同。


7、网易:子曰

早在2月9日,网易有道方面透露,有道AI技术团队已投入到ChatGPT同源技术(AIGC)在教育场景的落地研发中,目前该团队已在AI口语老师、中文作文批改等细分学习场景中尝试应用。

同时,公司有望尽快推出相关的demo版产品,该产品的面世将标志着AIGC技术在国内互联网教育场景的首次着陆。

网易有道专为教育类场景自研的类ChatGPT模型“子曰“将于近期开放内测。

①在教育内容的数据方面,网易有道在语言学习方面有着较为深厚的积累,2007年网易便推出了有道词典,这让网易积累了较多的语言学习数据,为“子曰”提供了良好的培育土壤。

②在算力方面,针对教育垂类,成本将有所下降。有道词典笔P5产品已升级至NPU方案,相对CPU版本模型推理速度提高了数倍,实现了“一目十行”的识别效率;在模型大小增加15倍的基础上,AI引擎的精确度也获得了大幅提升。且网易有道在AI算法方面也处于国内较为领先的地位,不过有道“子曰”的最终效果能够达到何种程度目前尚不得而知。


8、360:360智脑

4月9日,360的大预言模型「360智脑」开放预约,即将在4月16日开放测试。

一经上线,涌进2万多人预约。
2023-04-11_194816.jpg

“搭不上ChatGPT这班车的企业会被淘汰。”周鸿祎与张朝阳在一档栏目中如是说,而日前,360版本的GPT已经被红衣教主“抱出来让大家看看”。

早在3月29日,在数字安全与发展高峰论坛上,周鸿祎发布了360版“ChatGPT”。

从现场演示来看,360版GPT确实已经具备一定的推理能力,但在回答问题时,仍需要多次提问、提醒才能得出让人比较满意的答案。

2023-04-11_194850.jpg

此外,周鸿祎还表示360很快便会推出智能办公产品,并加上类 ChatGPT的能力,这一点和微软office软件的发展方向也是类似的。

此前,360称,目前360搜索是中国搜索引擎的Top 2,市场份额为35%,但截至目前仅作为内部业务自用的生产力工具使用,且投资规模及技术水平与当前的ChatGPT 3相比还有较大差距,各项技术指标只能做到略强于ChatGPT 2。由于训练数据源及应用方向的原因,在中文环境下的实际效果强于ChatGPT 2。

同时,360在数据资源端有丰富的多模态大数据积累和相关语料、尤其是中文语料,相较于国外同行落后的是预训练大模型和有效的多模态数据清洗与融合技术。公司有充足的资金储备可用于购买大规模算力,在继续深入自行研发的同时,不排除寻找强有力的合作伙伴,以开放的心态搭建多方共享平台、补足短板,快速缩小差距。

周鸿祎曾表示,360的人工智能战略用四个字形容就是“两翼齐飞”,先占据应用场景,同步全力发展核心算法技术。


9、光年之外:广纳AI人才

2月13日,原美团联合创始人王慧文,发了一条“英雄帖”,称要出资5000万美元,打造中国的OpenAI(ChatGPT主体公司),同时为自己的新事业招募人才。
2023-04-11_194927.jpg

第二天,北京智源人工智能研究院副院长刘江在朋友圈发文表示,已经决定加入王慧文的光年之外团队。

并称,将帮助王慧文打造中国AI大模型梦之队,对标OpenAl,打造中国自己的ChatGPT和基础大模型。

2023-04-11_195000.jpg

接着,搜狗输入法之父马占凯,发表微博称加入光年之外。
最近披露的消息是,光年之外与国产AI框架一流科技(Oneflow)将达成并购意向。目前该消息已被证实,尚在谈判中。

可以看出,无论是框架层面、模型算法层面,还是AI产品层面,人员正在齐备,光年之外的类ChatGPT产品雏形正在慢慢清晰。


10、中国版ChatGPT的困境

摆在中国ChatGPT面前的问题,还不仅是硬件和训练成本。

数据语料库并不完备。一方面是在英文网站和搜索引擎内中文信息与资料并不全面,这就会造成所训练的模型对于中英文问题的回答质量并不一致。另一方面,国内互联网如百度、微信、360、科大讯飞等在简体中文之外获取的信息有限,而像知乎、微博等网站,同样缺乏非简体中文的内容全面性。

此外,在自然语言理解方面,中文的多义性有天然的高门槛,而像ChatGPT这类产品背后是整个互联网庞大的语料库,对于国内平台来说自然无法避免合规性的问题,因此除了自然的理解与回到用户的各种刁钻问题,中国版ChatGPT也需要比国外同类产品更严格的审核机制,甚至在早期可能还需要人工审核的存在。

最后,目前的AI简单粗暴的植入互联网产品的方式,并没有形成变革性的应用场景,也没有改变用户与产品之间的交互方式,也没能提高产品服务的效率,无法体现AI的实际价值。

正如李开复在发圈入局时所言,“我认为AI2.0不仅仅是个高能聊天工具,也不仅仅是图文创作的AIGC生成,Co-pilot和如今看到的应用都还只是AI2.0能力的开端。”

到底谁能在AIGC领域率先封王,我们拭目以待。

作者:产品笔记
来源:https://mp.weixin.qq.com/s/RL66p4ZbDyRPjiiadtBetA

最新经典文章,欢迎关注公众号



没找到任何评论,期待你打破沉寂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条