百度发布的是“文心一言”还是“温馨遗言”？

汤十三青年横财发展会

昨天下午两点，百度召开了旗下大语言模型“文心一言”的新闻发布会，这是继“文心一格”之后的另一款生成式AI产品。

百度创始人兼CEO李彦宏在发布会开场时先来了一段深情自白：“全球的大厂当中，百度是第一个发布的，微软是直接调用Open AI，而Google和Facebook等大厂都没有发布同类型、同级别的产品。

”以及：“在文心一言内测过程中的体验来说并不完美，因为市场有需求才选择在今天发布。” 所谓的市场需求便是在当前ChatGPT“肆虐”全球的国际形势下，我们急需一款自己的人工智能语言模型来提振士气，所以这场发布会注定备受关注。

从发布会来看，文心一言可以进行

文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成。

咱就从文学创作开始，文心一言根据提问提炼总结出了每部《三体》的故事脉络，并且从生命的意义、人类与宇宙的关系、道德和伦理、价值和信仰、科技与人文的关系这五个方面提出了续写建议。

文心一言在更加复杂的数理逻辑推算功能方面的表现也堪称完美，面对经典的“鸡兔同笼”问题，它能够像学神附体一样质疑题目的正确性。

它还能将解题思路工整地写下来并给出正确答案。

而压轴展示的功能就是万众瞩目的多模态生成。多模态生成，说人话就是文心一言可以用文字、图片、音频或者视频的方式输入信息并输出符合要求的文字、图片、音频或者视频，属于目前的黑科技。文心一言用极快的反应时间就根据要求生成了一张“2023世界智能交通大会”的海报，这就是属于输入文字输出图片的多模态生成。

耐人寻味的是，发布会上关于文心一言的演示全是录播，没有一段实机演示，导致现场弥漫着一股诡异的气氛。在展示出种种革命性的功能时，台下乌泱泱的观众并没有爆发相应的欢呼和掌声，跟我看过的任何一场发布会都形成了鲜明对比。

而李彦宏本人也没有表现出自己公司潜心多年搞出划时代产品的那种自信神态，反而像一个学生在硬着头皮依靠拖延战略来答辩，简称依托答辩。 二级市场也给出了质疑，项目演示开始不久，百度股价便应声跳楼，几分钟内暴跌10%。

顺带一提，文心一言的同门“文心一格”，是一款百度旗下的AI画图产品，有好事网友用它生成了“一只爱国的猫”，居然全身美国国旗彩绘。战狼看了要虐猫，昊京看了也要吃不下白象方便面了。

Stable Diffusion是一款热门的画图AI，该网友的意思是，文心一格只是接入了Stable Diffusion的API。

就像你喊我给你画个图，我反手就一个电话打给我表哥喊他画完V我，我再V给你。同为好事之徒的我用另一款叫Midjourney的画图AI也生成了类似图片。

△Midjourney

有趣的是，我给的关键词同样是“一只爱国的猫”，但Midjourney识别出我使用的是中文后就给这只猫加上了像那么回事的中国元素。

咱说回文心一言，在问世之前，大家就把它对标ChatGPT，但在发布会之后，大家一致认为这不过就是个ChatPPT，所谓期望越大失望越大，也难怪网友会传出这样一幅恶搞图。

△看包浆梗图，品百味人生。

吐槽归吐槽，百度的勇气还是值得称赞的，有一种壮士赴死的气概。作为文心一言对标产品的ChatGPT在百度发布会前一天发布了自家产品的升级版GPT-4。

△我问了一下ＣhatGPT对于这次发布会录播演示的看法

相较于已经技惊四座的GPT-3.5来说，GPT-4显得更为惊艳，ChatGPT经过这次迭代已经进化成一个大型多模态模型，在文字交互方面也超过了上一代非常多。

虽然GPT-4目前只支持输入文本和图片输出文本，但它输入图片输出文本的能力已经远远超出大家的预期，甚至能让人感到脊背发凉。

GPT-4之于上一代，在文本的输入限制和记忆上都有了大幅提升，使得它与用户之间的对话具有更好的准确度和逻辑，先来直观感受一下GPT-3.5和GPT-4的数据投喂量差距。

GPT-4在天量数据的支撑下已经能在号称美国高考的SAT中获得1410分的好成绩（总分1600），已经超过了90%的人类学生。

最亮眼的还是GPT-4在专业领域的表现，它在美国BAR律师执照统考中同样超过了90%的人类，在MKSAP 19医学知识测试和高级侍酒师理论考试中则是超过了75%的人类。这些成绩对于GPT-3.5来说是遥不可及的。

△GPT-4在多项考试中远超GPT-3.5

英伟达AI科学家Jim Fan对此感叹道：“GPT-4最强的其实就是推理能力。它在GRE、SAT、法学院考试上的得分几乎和人类考生没有区别。也就是说，GPT-4可以全靠自己考进斯坦福了。” 在多模态生成方面，GPT-4的表现更是令人头皮发麻，Open AI总裁在发布会演示中手绘了一张笑话网站的样图。