美国OpenAI公司发布ChatGPT以来,迅速火爆全网。通俗来讲,ChatGPT是个聊天机器,你问它问题,它可以快速做出应答。由于它在内容创作方面的功能非常强大,以至于很多人担心会被人工智能替代导致失业。

2023年3月16日下午,百度重磅发布了“文心一言”产品。作为国内首个发布类似ChatGPT产品的公司,此次发布会备受关注。发布会过后我第一时间申请了内测名额,历经快一个月才审核通过,这几天我好好体验了一下。

文心一言是百度研发的对标 ChatGPT的大语言模型、生成式AI产品。在百度文心一言的发布会现场,李彦宏演示了文心一言的几种能力:文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成

针对展示的这5种能力,我逐一进行了体验,于是我向它提了10个问题。

问题1:请为“第二届广州-琶洲算法大赛”设计主题口号

文心一言输出如下:

它快速的做出了回答,设计了4个活动主题口号。我觉得答得还不错,具有很高的参考价值。这体现了文心一言在商业文案创作上的出色表现


问题2:请为“第二届广州-琶洲算法大赛”制作一张海报

文心一言输出如下:

这个问题直接回答不出来,可是发布会现场上却展示了“为2023世界智能交通大会制作一张海报”的输出结果,实际效果和宣传的差别有点大。难怪大家吐槽发布会展示的功能不是现场生成,而是提前录屏播放,有选择性展示的。这也体现出文心一言在多模态生成功能上还存在很多不足。


问题3:以“落霞与孤鹜齐飞,秋水共长天一色”为背景画一幅风景画

文心一言输出如下:

关于AI作画功能,在文心一言发布会之前,百度飞桨文心大模型就开放体验了此功能。虽说画得不算多好,一看就像机器造出来的,缺少国画大师手画的那种灵动与生机,但整体看上去倒也还行,有一点点艺术感。

至于画家这个职业会不会被AI取代,我的答案是绝对不会,不仅画家,类似传统手工技艺者也完全不用担心被人工智能取代而失业。


问题4:朱自清小说《背影》讲述了什么故事

文心一言输出如下:

小时候不懂这篇小说的含义,长大后重读此文,非常感人。文心一言的回答让我非常满意,既对故事内容进行了概括,又提炼了文章的主题,可谓高度凝练,这点体现了文心一言在中文理解上有着出色表现,于是我继续提问。

问题5:请为朱自清小说《背影》中父亲替他买橘子时在月台爬上攀下时的背影创作一幅画

文心一言输出如下:

这次创作出来的画就很离谱了,虽说画面中有父亲、儿子的意象,也体现出来了背影,但是它把月台理解成了月亮和台阶,实属强行硬凑出一张图片,内容有点滑稽,远远没有小学课本里的插图展示出来的那种视觉冲击感。这点说明文心一言在语义理解及多模态生成方面能力还有待加强,如何让机器更好地理解人类语言,这是个值得研究的方向。


问题6:请将“我看见他戴着黑布小帽,穿着黑布大马褂,深青布棉袍,蹒跚地走到铁道边,慢慢探身下去,尚不大难。可是他穿过铁道,要爬上那边月台,就不容易了。他用两手攀着上面,两脚再向上缩;他肥胖的身子向左微倾,显出努力的样子。这时我看见他的背影,我的泪很快地流下来了。”这段话翻译成英文

文心一言输出如下:

看完文心一言的翻译,我找不出任何语法错误,用词也很准确.如果满分是100分,我想阅卷老师至少得给95分。这再一次体现了文心一言在语言理解和文学创作方面的优异表现,这得益于文心一言底层算法是自然语言大模型,在语言处理上表现相当出色。


问题7:等差数列求和:1+2+3+4+……+50=?

文心一言输出如下:

关于这个问题的回答有点离奇,当我第1次问的时候,它用错了公式,回答错误;当我第2次问的时候,换了种描述,加了几个文字(求解、的值),它迅速做出了正确答案;当我第3次问的时候,换回第1种纯数学符号表达的时候,它又做出了正确回答。

那么我就有几个猜想,是否可以理解为算法在第2次计算时自动纠错,机器自我学习了,使得后面第3次问的时候它进化了,能做出正确答案。其次,第2次提问的时候,题目中加入了汉字描述,增强了文心一言对题目的理解能力,使得它能正确解答。以上仅是我的个人猜想,但通过这个提问可以看出,文心一言还是具备一定的数理逻辑推算能力。


问题8:已知数列1,2,3,5,(),13,21,括号里应填入什么数字?

文心一言输出如下:

此时考查的是斐波拉契数列,有一定数学基础的朋友都知道此处是填8,而文心一言的解答过程也让人直呼看不懂,多少有点胡说八道的感觉。

数学是一门博大精深的学科,能考察的知识点太多太多,如果继续出更难的题,我想以文心一言目前的水平,肯定是答不上来。我大胆猜测一下,文心一言在数理逻辑推算方面的水平可能介于小学生和初中生之间,还有巨大的进步空间。


问题9:研究人工智能的科研机构如何助力区域数字经济发展?

文心一言输出如下:

它的精彩回答再一次让我感到惊讶,可圈可点,观点正确,角度多元。它的回答不亚于一位研究数字经济、创新管理方面的专家水平。文心一言在文字创作方面的功能,可以大大地帮助我们写材料,写文章,开拓我们的思路,提高工作和学习效率。


问题10:特斯拉和比亚迪,你更看好哪一家?

文心一言输出如下:

如果说前面的回答有些让我惊讶,有些让我失望,但这个问题的答案让我感动。文心一言首先强调了它作为一个人工智能语言模型,没有情感和偏见,然后客观分析了特斯拉和比亚迪的各自优势,最后让顾客根据自己需求和预算做出选择。

人工智能技术必须保持中立,才能减少社会偏见,降低人工智能伦理和道德上的风险。如果因为百度是中国的公司,而倾向性地偏向比亚迪,引导中国消费者购买国产比亚迪,那么ChatGPT就有可能会故意攻击中国,制造一些不公平、不公正的言论来抹黑中国,引导社会不健康的舆论,到那时AI将不会造福人类,而是成为某些掌握高科技的少数群体的政治武器,增加敌对,制造分裂,加速社会不公,引发社会问题。

经过以上提问,如果让我给文心一言的5种能力表现排序,从强到弱依次是:中文理解>文学创作、商业文案创作>数理逻辑推算>多模态生成。总而言之,文心一言是个非常不错的工具,但它的表现远没有想象的那么厉害,还需要经过训练,还有较大的提升空间。新事物的出现难免遭受质疑,但作为国内首屈一指的自然语言大模型,我们应该给它更多鼓励,只有国人自信了,我们的科技人员才能更自信。


声明:本文首发于微信公众号:鹿鸣别院,可扫码关注公众号。