从GPT-4 VS 文心一言畅谈百度的未来
作者:程序员小灰
随着AI的大火,最近AI圈可谓风云际会,各方大佬纷纷登场。在3月14日,GPT-4的发布会圆满结束,3月15日,百度的李彦宏也做了文心一言的发布会,没看过的小伙伴,可以在网上搜搜发布会的视频。
“文心一言”各种梗图
百度真“人工”智能
机智的网友让GPT-4评价文心一言,上演现实版的同行相轻
发布会上李彦宏步履蹒跚,表情略显紧张,没有往日的自信从容。那么百度的文心一言和GPT相比到底实力如何?是骡子是马,咱们拉出来遛遛。
GPT-4 VS 文心一言
接下来主要从多模态生成,数理逻辑推算,编程方面,拟人化,算力方面,中文理解,应用生态等方面分析下到底谁强谁弱
GPT-4
OpenAI老板Sam Altman评价GPT-4是目前为止最强的AI,根据OpenAI官方的介绍,GPT-4是一个超大的多模态模型,它的输入可以是文字(上限2.5万字),还可以是图像
最令人惊讶的是只需要简单在纸上画一个网站的草稿图,拍一张照片上传给GPT-4,它就可以立马生成网站的HTML代码!(以后程序员真要失业了)
OpenAI自称:在各种专业和学术基准上和人类相当!敢这么狂妄,背后还是有东西的!
多模态能力
所谓多模态能力,即可以接受图像输入并理解图像内容,并且可接受的文字输入长度也增加到3.2万个字符(约2.4万单词)。比如模拟律师考试,GPT-4取得了前10%的好成绩,相比之下GPT-3.5是倒数10%,做美国高考SAT试题,GPT-4也在阅读写作中拿下710分高分、数学700分(满分800)
看图能力可以用来解释表情包、梗图
提问这张图哪里好笑?GPT-4可以按顺序描述出每一格的内容,并总结出笑点:
用巨大的过时VGA接口给小巧的现代智能手机充电
数理逻辑推算
发GPT-4可以理解图表中数据的含义,并做进一步计算
编程方面
发布会直播上,OpenAI总裁现场表演了一波GPT-4给代码修Bug
出现问题啥也不用想,直接把2.4万字的程序文档一股脑扔给GPT-4就行。你只需要精通CV(复制粘贴)大法即可
并且能在几秒钟内瞬间得到解决办法
拟人化
GPT-4还开放了一个使用功能,允许修改“系统提示”,使其感觉更像真人一样!之前ChatGPT的回答总是冗长而平淡,这是因为系统提示中规定了“你只是一个语言模型……你的知识截止于2021年9月。现在通过修改“系统提示”,GPT-4就可以展现出更多样的性格,比如扮演苏格拉底
应用生态
必应早就用上了GPT-4,并得到了微软方面的证实
微软给OpenAI提供超算服务吸引企业来使用Azure训练自己的大模型,同时直接在Azure中提供OpenAI模型服务(Azure OpenAI Service),此前包括GPT-3、Codex和DALL·E 2等模型,都已经接入Azure
中文理解
GPT-4在中文理解方面的确稍逊一筹。
文心一言
和GPT-4一样,文心一言是一个多模态大模型。李彦宏会上展示了文心一言具备的5种能力,包括
文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成
文学创作
在文学创作上,李彦宏先来了一个最简单的提问,问《三体》作者是哪里人?先让文心一言介绍一下大刘,“毕竟我(文心一言)和刘慈欣是老乡嘛,都来自阳泉”
结果大错特错,直接把刘慈欣的老家张冠李戴到了湖北省洪湖市
商业文案创作
比如给新公司起个名字,并且这个名字它还有理有据,有迹可循
中文理解
发布会上,李彦宏向观众展示了文心一言对中文的理解能力,并自信地说:文心一言对中国文化的了解,理应超出任何一个预训练大模型
为了证明这一点,李彦宏输入了一个问题:“洛阳纸贵。到底有多贵?”,文心一言不仅展现了历史渊源,还介绍了这个成语背后的经济学原理
我们再来问问GPT-4呢
在标准化的回答方面两者似乎旗鼓相当
那么,难度再提高下,看看二者写藏头诗的能力
GPT-4没有真正理解“藏头诗”的含义
在中文理解上,属实是文心一言“小胜一筹”了。不过在英文上,李彦宏也承认,虽然文心一言也能处理,但能力是显著不如中文的。
数理逻辑推算
数学思维能力方面,文心一言处理的数学问题不算复杂,是小学常见的鸡兔同笼问题
有趣的是,李彦宏现场展示的第一题,引得文心一言说出了《狂飙》里高启盛的经典台词:这题出得不对。看起来更具拟人化
李彦宏表示,这些题“不敢说百分之一百能做对,但至少体现了文心一言的思考历程”
在逻辑推理方面相比GPT-4,个人觉得文心一言处理的还是有点小儿科了,拟人化方面暂时先对半分吧
多模态能力
为即将到来的2023世界智能交通大会创作海报,并且支持文字转视频,文字转语音能力
相比GPT的强大,文心一言差的不是一星半点
编程方面
有些遗憾的是,在ChatGPT被频频称赞的编程方面,文心一言并没有现场展示相关能力,只能认为目前不具备或者只具备很弱的能力,和GPT不能相提并论
算力方面
文心一言底层算力支持,是位于李彦宏老家阳泉的百度阳泉智算中心,专门为自家大模型产品文心一言提供计算推理的算力需求,阳泉智算中心是亚洲单体最大的智算中心,算力规模可达4EFLOPS(每秒400亿亿次浮点计算)
但相比微软的大投入,上万张英伟达A100芯片,几十万张GPU还是稍逊
应用生态
目前,文心一言在百度内部已经接入百度搜索,小度和自动驾驶Apollo等产品,外部包括爱奇艺等650家公司也已经接入
生态方面也仅限国内相比还是不足
文心一言背后原理
据王海峰(百度首席技术官(CTO),深度学习技术及应用国家工程研究中心主任)介绍,文心一言主要脱胎于两大模型,六项核心技术。
两大模型:
百度ERNIE系列知识增强千亿大模型,以及百度大规模开放域对话模型PLATO
六项核心技术:其中三个是广为人知的大模型技术,包括有监督精调、人类反馈强化学习和提示构建。另外三个,则是“百度特色”的技术,
包括知识增强、检索增强和对话增强技术
总结
诚然,文心一言和GPT-4还有很大差距。虽然网上很多人对文心一言抨击的一文不值,批评的体无完肤,但是这也是大家对百度的期望太高。对比GPT-4的光芒万丈就显得自惭形秽了,但百度作为国内AI的头部企业实力还是不容小觑的,在中文处理方面有着得天独厚的优势,而且在AI的很多应用场景也有着自己的贡献。
希望大家能理性看待百度的文心一言,虽然还有缺陷,但随着时间的流逝,我相信国产AI会有着属于自己的辉煌,让AI真正的服务给更多的人。
就像有句话说的,世界上不能只有一种声音,一枝独秀不是春,百花齐放才是春。
以上就是从GPT-4 VS 文心一言来探讨百度的未来在哪里的详细内容,更多关于GPT-4 VS 文心一言的资料请关注脚本之家其它相关文章!