3月16日文心一言正式对外邀请内测,我们也在第一时间申请到了内测资格,这几天小伙伴们玩儿“文心一言”玩儿得不亦乐乎,他们甚至花了半天时间把文心一言给“玩坏了”。



从我们的体验结果以及网上拿到内测的用户的分享来看,文心一言的表现是超预期的,虽然李彦宏和王海峰在发布会上很谦逊也只放了视频,但这不代表文心一言不能打。


除了可以AI作画外,文心一言还可以给我们的编辑推荐玩3A游戏的笔记本电脑:



我们编辑要去北京参加某个发布会,文心一言也顺便推荐了他在北京旅游的路线:



而文心一言被“玩坏”是因为一道脑筋急转弯问题,但万万没想到的是,文心一言在一轮轮的交互反馈中不断改进答案,竟然“圆回来”了。



这几天在和小伙伴们一起“玩儿了”ChatGPT和文心一言的过程中,我的整体感知是,文心一言并没有许多人吐槽的那样“弱鸡”(当然吐槽的大都是对百度有偏见的人),在文学创作、知识梳理、数理逻辑推算这些大模型都能做的标配功能外,文心一言在有几个维度表现更突出:


一个是对中文的理解特别是古典文学、方言上,比ChatGPT强得多。


作为一名重庆人,对自己的普通话水平我还是有自知之明的,毕竟四川话与普通话结合的“川普”也声名在外,我也试着用“川普”去问文心一言问题,结果都能无障碍听懂:



翻译一下:在四川话里,“晓得”是“知道”的意思,“撒子”是“什么”的意思。


文心一言对我家乡的了解程度,丝毫不亚于我本人:



很多人说重庆美女多,去重庆一定要“大饱眼福”,为什么我这些年一直没搞清楚,现在文心一言给出了答案:



除了四川话,文心一言也能理解东北话,ChatGPT则直接被问倒:



这反映出文心一言在中文世界“土生土长”的优势,基于百度在中文互联网二十多年的沉淀,文心一言对中文以及中国文化还是有着很深刻的理解的。中文是世界最复杂的语言,文心一言可以做好中文,要做好英文以及其他语言应该不是太难的事。


第二个是对网络热点更加敏感。ChatGPT的知识停留在很早以前,但文心一言可以理解网络热梗,解读热点事件,比如可以理解“肯德基V我50”、“疯狂星期四”的梗,ChatGPT完全不知道在说啥。


这是因为基于百度搜索业务的数据内容积累,它更有“时效性”更前卫一点。ChatGPT底层GPT-3“学习”的内容是过时的,肯德基V我50的梗,当时不够火。



对网络热点更敏感,知识更“新”,意味着应用场景大不一样。作为一个科技媒体编辑,我们日常创作内容需要大量的时效性资料作为素材,文心一言给出的答案,让我觉得很惊艳。


科技媒体每年都会围绕iPhone年度新品做很多爆料文,2023年关注iPhone 15,文心一言准确地给我收集了iPhone 15的爆料汇总,从外观到功能到芯片到续航一应俱全——日常科技媒体做新机爆料基本也是这么个套路。



第三个是创作辅助,文心一言已到了接近可用、勉强能用的水准:


如果你认为文心一言只会做简单的信息收集整理工作,那你就小看TA了,科技自媒体在做的热点事件分析、产业财经分析它都可以给出像模像样的答案。


财经编辑会关注很多中概股的动态,2023年中概股为何反弹?它的分析还是很到位的——不过跟所有财经自媒体一样,TA也很有操守,坚决不荐股(这也是违规违法的):



文心一言还可以帮我查询我关注的股票的市值(不过我看了一下中国移动最新市值超过2万亿美元,已经超过茅台了,不知道为何文心一言会出错。)



对于一些互联网行业的热点事件,文心一言给出的分析也头头是道,比如前段时间热议的“抖音做外卖事件”:



3月17日,第一批智能音箱创业公司叮咚智能音箱宣布停止服务,对此,文心一言也有自己的见解,同时还强调,不是不看好智能音箱市场:



文心一言当然不会不看好智能音箱,TA和百度旗下的小度还有很多合作空间,大模型技术也将会给智能音箱以及智能语音助理带来全新的可能性:



文心一言还有一个特别贴心的功能,就是“重新生成”,也就是说它理论上跟搜索引擎一样可以给用户多个不同“版本”的答案,直到用户满意为止,用户也可以对结果进行反馈比如点赞,这样的反馈会加速文心一言以及底层的大模型技术的进化。


比如我问TA对造车新势力的看法:



对于这个回答我不是很满意,造车新势力怎么可以没有小鹏呢?于是我让TA重新回答,结果就好多了:



对于近期的汽车厂商价格战,它的分析也是有理有据的,虽然不能直接拿来作为对应话题解读内容的素材,但是提供了一个基础思路或者说提纲:



站在科技编辑角度来看文心一言的表现,我觉得有些后背发凉,因为它的水平已经达到很多初级编辑或者说实习生的水平了,既有信息收集整理能力,也有逻辑推理能力。科技编辑需要重新思考自己工作的价值了,只有找到“文心一言不能做,我能做”的事情才不会被替代。


当然,对新媒体行业特别是内容平台来说,接下来可能也需要升级一下原创保护体系,因为可能会有自媒体、做号党已经在用文心一言协助甚至直接创作文章获取流量赚取补贴了。


我今天打开知乎看到了三个推荐的问题:



我想试试看,这三个问题文心一言能不能回答?第一个问题:“ChatGPT是否会取代律师?”:



好家伙,答案有条有理,看着还很专业,笔者突发奇想,干脆直接贴到知乎,看看有没有人点赞呢?



第二个问题:“为什么有的房东喜欢把房间租给女租户?”,文心一言的回答都在点子上了:



第三个问题:“第一次去女友家,女友叫我带五箱茅台, 20 条软中华,同时带大红包,怎么办?”回答得比较一般,主要内容是怎么给女朋友挑礼物:



整体来说,文心一言可以回答很多知乎问题了。我在想,随着更多人拿到文心一言的内测资格,知乎以后是不是会有一些“AI答主”呢?这可能比“人在美国,年入过亿”的“杜撰写法”对平台的冲击还要大。


内容平台怎么规避AI原创?内容机构如何用好文心一言的辅助创作能力?内容创作人才如何重新规划职业方向,都是接下来非常值得新媒体行业关注的话题。


还有,文心一言的辅助创作能力不只是在媒体业体现,在市场营销行业同样有很出色的表现,比如写商业文案的水平也很高了,有的答案算是惊喜,“享受美味,从一碗开始”单单是这句slogan,康师傅就可以给文心一言打赏了,很多结果打工人也可以拿来作为初稿再改改提高工作效率少熬夜:




第四个是数理逻辑推算,文心一言表现比ChatGPT更优秀。


文心一言很多时候表现都比ChatGPT要聪明一些,比如回答青蛙跳水井、鸡兔同笼这样的问题时,表现都比ChatGPT好。



当然有一种可能,文心一言不是自己做的数理推算,而是根据一些经典数理题库总结得到答案,因为百度上有许多类似的题库以及答案,这样也算投机取巧,但内部技术怎么运作的不知道。


第五个是多模态生成,很多人说GPT-4出来了文心一言没得玩了,其实文心一言的多模态能力很强,语音、图片、视频都能生成,甚至支持方言语音的生成。最近广州是赏花季,满大街都是黄色风铃木和紫荆花,文心一言帮我“记录”了这一刻,虽然广州塔有些抽象,但这张图整体还是很美的:


而GPT-4目前做到的只是图片内容的输入,而不是生成。所以千万不要想当然地觉得“月亮国外的就更圆”。


第六个是生活服务层面,文心一言比Siri类智能助理智能了许多,完全可以作为我们生活中的实用工具,比如提供面试攻略:




再比如告诉你如何委婉地拒接别人借钱:


还可以和你一起追星聊八卦:


整体来说,文心一言的表现不只是超出预期,而且很多时候会给出令人惊喜的答案。


看得更远一些,文心一言要做的是各行各业的生产力工具,就像iPhone诞生催生了数百万的移动开发者一样,文心一言未来也将依托百度智能云这样的平台,给产业中的企业提供创新的基础能力,企业和开发者可以基于它开发出更多我们今天难以预见的创新应用。


未来已来,这一切还只是开始。养兵千日、用兵一时百度也将迎来属于自己的黄金时代。最后话说回来,不管你怎么看待百度,但中国真的十分需要文心一言这样的拥有自主技术的科技基础设施,中国除了百度还有谁能跟OpenAI PK?我想不到第二个。