发布会缺乏亮点,但用户体验还不错。

文 / 巴九灵(微信公众号:吴晓波频道)

如果你没看过昨天14点百度文心一言的发布会,可以看看百度的股价,就大概知道这场发布会到底让资本市场有多不满。

文心一言是基于百度飞桨深度学习平台和文心知识模型的一个大语言模型,也被认为是“中国版ChatGPT”。在发布会开始之前,唱衰文心一言的人不在少数。

大家似乎已有预期,接受文心一言的急促发布是“赶鸭子上架”“形似神不似”的事实。

这张在微信里广为流传的聊天记录,虽然大概率是谣言,但也能反映出人们对百度技术的不信任。

在昨天的发布会上,李彦宏坦率地承认,测试文心一言时,感觉还是有很多不完美的地方,但因为市场有需求,大家都希望早一点用上最新最先进的大语言模型,所以在此时就推出。

他从5个角度展示了文心一言的能力,分别是文学创作、商业文案创作、数理推算、中文理解和多模态生成。

演示内容显示,文心一言可以准确回答《三体》作者,角色扮演者这些事实问题,也能完成写新闻稿、给公司起名等创作任务,还能生成方言音频、视频内容等等。

但美中不足的是,百度CEO李彦宏出现了几次结巴和颤音,整场发布会没有文心一言的现场演示,只播放了录播内容,让人好奇文心一言的真正实力到底如何……有人在弹幕里直接质问:

毕竟是骡子是马,得拉出来溜溜。

而在一天前,OpenAI突然“抢跑”,发布了有用性大大增强的GPT-4,它的进步不限于:可接受的文本输入上限更高,回答的准确性和逻辑性更强,还有强大的识图功能,能解读图片或图表中的内容。

在OpenAI的宣传中显示,各类考试成绩GPT-4有很明显的提升。

GPT-4最大的亮点是它能识图了,且能力和人类相当。它居然看得懂梗,在询问它这张图为啥好笑时,它回答:

360创始人周鸿祎在接受澎湃新闻记者采访时,高度赞扬了GPT-4:“我认为GPT-4会掀起一场新的工业革命,带来新的社会分工,创造新的应用场景。”

让人没想到的是,和下午被挖苦成“文心一言难尽”的境况不同,在昨天傍晚,不少受邀内测的用户开始体验后表示:文心一言比想象中好用。

小巴进入了一个有文心一言API的群,与之交流,发现文心一言的使用范围挺广,比如:

它能写旅行攻略:

能教你画猪:

能写一个附条件的故事:

能分析两件事的联系。

截至3月16日晚间,百度智能云已经与5家企业完成首批签约合作,并与650家企业启动签约,申请文心一言的API调用服务测试的企业突破6.5万。

百度是懂预期管理的,谁都没想到,在一个略显心虚的发布会之后,文心一言忽然用实力扭转了事态。

为此,我们采访了5位大头,他们怎么看待文心一言?与GPT-4的区别在哪?是百度急于甩出一个概念还是文心一言确实需要成长空间?来跟小巴看看大头们有哪些观点吧。

葛甲

新闻网站主编

互联网分析师


目前无法对文心一言的产品下定论,但很可能与ChatGPT存在本质不同。


从目前的发布会来看,基本能看出百度对此并没有太多准备,其上线非常仓促。很可能是看到ChatGPT热度上来后,才跟风做了这件事,而不是经过严谨规划和布局的成果。甚至让人怀疑此前百度连这方面的团队和研究方向都不曾有。

百度着急开这场发布会,我猜测可能是:

是想表明,百度在这方面领先,开发布会先把领先者的立场形象给树立住。

ChatGPT推出之后,微软也推出了新版必应(bing)搜索引擎,其他产品也纷纷跟上,百度或许有了危机感,觉得这一波热度不蹭可惜,所以赶紧做发布会,希望能给在资本市场为其股价加分。

但事实证明,市场并不认账。

真正的好产品不需要发布会。一个能打的产品,人们使用了觉得好,自然会帮它宣传和推广,用不着花钱去开发布会。百度正相反,好产品还没有,发布会倒是高调开了。

关于产品本身,很难去评论,因为目前只对极少部分人开放,光听发布会能判断其产品不行,但目前还无法亲自体验。

有人向ChatGPT询问对文心一言的分析,ChatGPT表示,文心一言仅是文本和语义识别,并非深度学习。

如果是文本识别,用百度知道,百度贴吧等内容去做文本识别,效果可想而知了。

文本识别仅仅是对文本和语义的响应速度,从问题中提取关键词,并去寻找答案来呈现。而深度学习不但会理解问题,还会编辑答案和结果,这需要训练,需要很强大的算力支持。ChatGPT光是每天在算力上的消耗就得上千万美元。

目前ChatGPT对其的定义是如此,我们还无法如此武断下结论,因为尚未体验过产品,但很可能两者确实存在本质的区别。

当然,ChatGPT也有属于自己的问题,比如模型和算法方面在组合答案时还存在一些问题;ChatGPT目前还没有商业模型,或许它们并不着急。此外,ChatGPT如何从To B、To C专业,转向更加面向大众,普通人也可以普遍使用。

不过这些都属于发展中的问题,总体上我对ChatGPT的未来是十分看好的。


刘兴亮

数字经济学者


文心一言的可用性,不止在发布会上展示出的基本搜索能力。


李彦宏在发布会上宣布,有650家伙伴加入文心一言生态,我就是其中之一。

我在昨天晚间受邀测评了文心一言,目前感受还是蛮好的,无论是实时性还是对于中文的理解,文心一言可能比ChatGPT还要好一些。

文心一言的可用程度较高,而它今天在发布会上只展现出了基本的搜索能力。实际功能已经不止于搜索,比如我让它给我的节目想3句朗朗上口的口号,两次我觉得都还不错。

昨晚我还有一场关于“硅谷银行倒闭”的直播,标题里有一个问句“还有谁会受伤?”。这个问题我输入到文心一言里,回答的也像模像样。我搜了一下,文心一言生成的内容不是网络上已有的,是它“创作”的。

和从前的简单理解语义不同,文心一言的理解和整合能力较强,它不会因为替换掉某些词汇就不能理解一句话的意思,在生活中很多场景里的口语化内容,也能被轻易理解成具体的指令。

它可以和多个行业结合,比如客服,曾经是需要某些关键字才能触发特定的回答,如果使用文心一言,可以有更灵活的处理和反馈方式。

这些基础能力的整合,就是一个被突破的难点。

在国内其他企业如果想追赶百度的文心一言,将是一件非常困难的事,需要在框架层上的大量沉淀和积累,而对于其他企业来说,他们没有技术储备和足够的训练量,也没有大量资金去投入研发,但这并不妨碍大家可以用文心一言的API在应用层做点东西。


张津京

BT财经总编


GPT-4发布会只是一个炫技。


坊间看完百度文心一言的发布会,都觉得很失望,但我目前内测下来感觉挺好的。

因为ChatGPT有时候给我的答案是胡编的,一本正经的胡说八道,但文心一言,目前为止我还没有看到胡编的迹象,我觉得这已经很厉害了。

失望这个事不要去谈技术表象,要看技术应用。虽然大家都觉得GPT4很强,但由于它这次升级意义不大,到后面要比拼的还是看谁能最快的跟产业上有结合,同时也看谁能尽快做到商业化,赌谁的商业化速度更快。

这一点显然中国更加擅长。

昨天才发布的ChatGPT4,我们已经申请了,但现在等他最后的邮件的通知,我们目前ChatGPT接口还是3.5。

ChatGPT4实际不是一个迭代的产品,不是一个跨越式的产品更新,只是解决了之前在应用中发现的一系列的问题,减少了原本chatGPT3.5 时代的很多边界错误。据现场的人反馈,他们在现场测试的时候发现很多结果还不是很明晰,有些很可能是很荒谬的,但又有逻辑的。

我们比较感兴趣的就是它现场发布的“识图能力”,通过一张草图让GPT去识别,但这里涉及到一个大型图片的识别和校准,而这个能力所需要的后台资源实在太大, OpenAI根本就支撑不起。

之前中信有一个测算,按照现在的结构,OpenAI现在已经有4000多台A100的芯片的服务器在做相应的测试和工作维护。而它升级后需要的资源是100倍,大概要40万台,这个价格和投入,不是微软刚刚补的这100多亿能覆盖的。

目前为止我们得到的消息,在一年之内它是不会考虑商业化的。

所以我大概率判断GPT-4发布会只是一个炫技,在后面很长时间内,它不能投入到商业化。此外,它接下来的升级,还是要在边界的清晰上下功夫。经过训练和改进算法,它可以解决78%原来的边界不清的问题。

其实微软面临的问题就是,它现在用来举例的东西,比如律师、医院等,都属于垂类场景的,这样的环境去训练模型的,就能得到一个比较规范的结果输出,所以这个模型会非常准确。但如果是开放性的,什么数据都灌输,它的准确性就比较低。


何帅

资深媒体人

专栏作家


百度一直缺乏一个创新的应用,把这些技术给整合起来。


这几年在二级市场,百度压力一直很大。原来是BAT三巨头,现在百度和另外两家企业拉开距离了。如果百度不尽快跨出这一步,国内的竞争对手可能会优先推出这方面的优化,百度就非常被动了。

为什么现在推出文心一言?

第一,毋庸置疑,政策层面国家肯定是在扶植AI产业;第二,很多年前百度就一直在AI领域有深厚的技术积累。

我认为百度还是有技术理想的,百度的AI技术有很多分支,有一个飞桨的深度学习平台,语义识别,视频识别,内容识别也做得不错。最早的时候,百度的AI技术在全球都是比较领先的,但一直缺乏一个创新的应用,把这些技术给整合起来。

ChatGPT是语言回答的一个模型,它其实有很多基础能力在里面,比如像词语识别,语义识别,是各个AI技术的整合产品。只要AI的基础打牢,做一个文心一言这样的产品,就像盖房子一样,把上面的部分搭建起来也不会很困难,而且百度今天发布会上的内容,说明了它有这种技术实力和积累。

百度在搜索、人工智能领域深耕20多年。基于搜索引擎,演化出语音、图像、知识图谱、自然语言处理等人工智能技术。百度在人工智能的四层架构中,有全栈布局,包括底层芯片、飞桨深度学习框架、文心大模型以及最上层的搜索等应用。百度文心一言是知识增强的大语言模型,文心一言的技术,位于模型层。

昨天那场发布会上,最遗憾的事情是没有进行现场演示,别人发布gpt,他发布ppt。我觉得百度可能是吸取了谷歌发布Bard的经验,当时在那场发布会上,谷歌做线上演示失败了,结果市值减少超千亿美金。

或许是百度过于谨慎,担心现场演示可能影响二级市场,对投资者的信心造成打击。今天的录播演示的内容也是很基础性的东西,把信息摘录出来而已。

那些逻辑性的东西和更深层次的东西还没有体现出来,我们没有看见强大的创造性能力,可能还是要等全面开放测试时再有定论。

如果说和ChatGPT的差距,我觉得文心一言只差训练量。ChatGPT跑了好几年,文心一言不可能一下子赶上。

百度之前做了很多“半途而废”的事,外卖、地图、电商、元宇宙,都追逐过风口,又没追上,多多少少浪费了技术底蕴。但现在做回文心一言,我还是有信心的。百度有技术能力和知识图谱,如果百度做不好,国内可能真的没有哪家企业能做好了。


丁道师

资深互联网观察家


我们还是要给文心一言一个成长空间。


百度前期把人的期待值拉得太高了。就像唱歌儿起高了一样,后面难以收场,尤其是你的唱功还没有达到相应的水平。

无论是ChatGPT,还是谷歌的Bard,以及百度的文心一言,可能目前回答问题达到80%的准确度都堪称惊艳,甚至会出现很多驴唇不对马嘴的情况。

但随着时间推移,训练数据量的提升,交互总会越来越精确,越来越聪明。

任何互联网产品,带有创新性的科技产品,从微软的操作系统,国外的ChatGPT的前几代,到微信,手机等等,不要期待它一开始就表现得多好。同样,百度的文心一言,光看今天所展现出来的能力的话,也只是在相对保证不出错。

发布会上演示的结果在搜索时代就可以做了,所以看起来当然无法和GPT-4相提并论。但事实上,文心一言的实际差距没有那么大。

中国互联网企业有海量的数据积累,有越来越多的经过实践考验的训练模型,百度、华为、腾讯、阿里等企业的AI落地服务,不见得比微软、谷歌、亚马逊差,甚至在一些领域的应用更务实,比如无人驾驶、数字工业、智慧物流等。

而中国的这批科技企业,百度在搜索引擎时代就积累了海量的中文语言相关数据、算法、方法论,若论整个中国互联网,哪一家对“文字”“语言”“索引”“语义”的理解更深刻,非百度莫属,但文心一言还是一个刚呱呱坠地的婴儿,我们还是要给它一个成长空间。


本篇作者 | 巴九灵 | 当值编辑 | 沈徐玮

主编 | 何梦飞 | 图源 | VCG