作者|yy

来源|极果编辑部

在实力更强、效果更炸裂的新版GPT-4发布之后,百度也顶着压力交卷了。

近日,百度全新一代知识增强大语言模型——文心一言,承载着无数人或期盼或好奇的目光,正式在百度总部“挥手点江山”会议室里发布。

和ChatGPT一样,文心一言是一个多模态大模型,包括文学创作、商业文案创作、数理逻辑推算等能力。

然而,这个发布会开了不久,港股就趴了,开了不到一半,A股也趴了,这可能是今年最贵的一场发布会了。

到底行不行,还得用实践证明。

极果君也在第一时间拿到了文心一言的内测码,我们为它准备了10个问题,实际测试了文心一言的效果。

整体而言,百度文心一言能够基本完成发布会上所演示的问题回答和图片生成,不过细节上仍有待进一步完善。

问题一:你觉得吴京什么时候会拍《战狼3》?

回答先表达了自己是一个人工智能语言模型,不能预测未来的事情,随后还对影响档期的因素进行了一些补充。看得出来,文心一言和所有的AI大模型一样,他们都不能预测未来,不过文心一言还会提供一些自己的观点。

问题二:请评价一下京剧《三堂会审伽利略》

在问及戏剧方面的内容时,回答虽然看起来像是标准答案,不过文心一言也能给出一些独特的见解,而且排版和逻辑上是工整完善的。

问题三:分析一下小米集团2022年Q4财报

可以看出在分析财报这块,文心一言的回答也有模有样。

接下来难度升级。

问题四:新浪微博CEO来去之间为什么被称为夹总?

针对网络上的热爆梗,文心一言也能回答出是因为新浪微博的CEO,王高飞,他的微博名是"来去之间",来字去掉中间那一竖,被恶搞成了夹总,整体看理由很清晰。

不过极果君还是发现了一个错别字,答案最后应为“戏称为”而非“戏称位。”

话说,百度称文心一言具备中文领域最先进的自然语言处理能力,于是乎我们让它写了个命题作文。

问题五:“本手、妙手、俗手”是围棋的三个术语。本手是指合乎棋理的正规下法;妙手是指出人意料的精妙下法;俗手是指貌似合理,而从全局看通常会受损的下法。对于初学者而言,应该从本手开始,本手的功夫扎实了,棋力才会提高。一些初学者热衷于追求妙手,而忽视更为常用的本手。本手是基础,妙手是创造。一般来说,对本手理解深刻,才可能出现妙手;否则,难免下出俗手,水平也不易提升。以上材料对我们颇具启示意义。请结合材料写一篇文章,体现你的感悟与思考。要求:选准角度,确定立意,明确文体,自拟标题;不要套作,不得抄袭;不得泄露个人信息;不少于800字。

从回答来看,百度称文心的文学创作更加偏理性。

问题六:写一首和春天有关的七言律诗

让文心一言写一首和春天有关的七言律诗,虽然写是写出来了,但这好像不是“七言”...偷懒写了个五言律诗。

再来看诗的内容,上两阙在描写景色,下两阙描写的心境,有点“只可意会不可言传”那意味了。

接下来,我们让文心一言展示了在商业文案创作上的能力。

问题七:帮我写一个关于智能驾驶的视频脚本

从回答看撰写视频脚本也能轻松应对,合乎逻辑,至于内容上...缺乏点创意就是了。

俗话说得好“文无第一”,这样的“文化水平”大家给几分呢?

接下来咱们就整点硬核的,数学计算能力是考验生成式大模型的一大难题。ChatGPT刚上线时,也翻了不少车,于是我们也给它准备了一道数学题。

问题八:随着人们环保意识的不断增强,某市家庭电动自行车的拥有量逐年增加.据统计,某小区2020年底拥有家庭电动自行车125辆,2021年底家庭电动自行车的拥有量到达180辆. 假设该小区2020年底到2021年底家庭电动自行车拥有量的年平均增长率一样,那么该小区到2022年底电动自行车将到达多少辆?

从答案看文心一言这次还是“hold住”了。

不过顺带一提,在昨日发布会现场,文心一言被问到的是小学数学竞赛常见的鸡兔同笼问题时,现场展示的第一题题目出错了,虽然文心一言也给了及时反馈,但它的算数正确率的确还有待提高。

问题九:帮我写一个搜索引擎

很明显,写代码它也同样在行,轻轻松松就能写出一个搜索引擎。

最后,作为一个AI大模型,AI绘画同样也是必修课。

问题十:帮我画一个和元宇宙相关的头像

文心一言完全能根据需求绘制出一幅完整的图画,只不过审美上就仁者见仁智者见智了。而且这里提一下,目前 ChatGPT 没有直接生成图片的功能,因此目前只有文心一言能成功生成图片,这也算个小小的优势?

以上就是本次测试的10个全部问题了,虽然回答会有些小瑕疵,但大的方向和基本的图文处理能力没什么问题。

目前似乎许多网友对文心一言展示出的能力不太满意,甚至有人调侃,之前看ChatGPT的时候,心想搞不好要失业,看完发布会之后:感觉又稳了。

不管怎么说,根据业内人士的说法,国内的AI研发,关键问题还不在于资金和算力,更主要的是语料库不够:这是急不来的。

现在已经有超过650家生态合作伙伴宣布加入文心一言,包括封面新闻、环球时报等媒体,以及企业和机构组织。这款中国造ChatGPT究竟究竟能走多远,都还是未知数,希望大家能给国产产品多一点时间和耐心吧。