在经过了此前的预热后,3月16日百度的文心一言终于与大家见面了。如果以一场科技企业推出王牌产品的发布会标准来评判文心一言的亮相,或许不及格才是唯一的答案,而这一点百度的股价无疑就是明证。在台上还开着发布会的时候,港股中百度的股价更是直接表演了一出“高台跳水”。

在文心一言这场发布会期间,网络上各种对于百度的调侃已然就满天飞了,甚至有好事者形容李彦宏的那根白腰带,都盖过了文心一言的光芒。其实外界对于百度的唱衰并非没有道理,虽然文心一言此次发布会本身中规中矩,诸如Demo演示、产品解读等等标准环节也都有,但一场万众瞩目的新品发布会居然是录播、而非直播,并且作为主讲人的李彦宏也表现出了紧张、而非成竹在胸的架势,这一切似乎都在表明百度这一回是露怯了。

看起来,文心一言似乎是翻车了。然而就在这场发布会的第二天,百度的股价大幅上涨15%。


那么为什么发布会还在开,百度的股价就“飞流直下三千尺”,反而发布会在结束后,股价却又“一飞冲天”了呢?其实关键点,就是文心一言本身经受住了考验,它的实际表现并没有发布会上显露的那般糟糕,反而大大超出了预期。


通常,科技企业在发布会上都会将产品吹得天花乱坠,性能、参数吊打各路友商更是不在话下,仿佛是“此曲只应天上有,人间难得几回闻”。结果用户实际体验后发现言过其实、不过尔尔,才是常态。


可百度这次却是反其道而行之,或许是看到了谷歌Bard的“翻车”导致市值一夜间蒸发上千亿美元这个前车之鉴,文心一言此次发布会用的是提前准备好的录播,李彦宏还亲口表示文心一言的体验还称不上完美。似乎给人的感觉是“就这”?甚至在一时间,GPT套皮的说辞也相当有市场。

等到当天晚些时候,百度开放了文心一言的实际体验后,外界则直呼“上当”。虽然文心一言的实际表现确实比不了OpenAI刚刚发布的GPT-4,但却有了与目前ChatGPT依托的GPT-3.5 turbo同台竞技的资格。除了在创作能力、摘要能力、图片生成等方面有着不错的表现外,同样也具备写写代码,以及一定的逻辑推理能力。


事实上,百度与OpenAI在这一领域还有着明显的差距,就好比是60分和90分的区别。


如果在智能手机、PC等成熟的消费电子产品领域,60分和90分这个差距是令人绝望的,60分的产品往往会被认为是“电子垃圾”。但文心一言所处的赛道却全然不同,作为开放公测的多模态大型语言模型,文心一言确实不如目前的ChatGPT,但问题是,这种差距反而证实了文心一言是真自研、而非“套皮”,百度也没有让员工来搞“人工”智能,更不是用了ChatGPT的API。

要知道,在OpenAI的ChatGPT、乃至更强大的GPT-4问世后,在部分人眼中中国AI产业界几乎可以用“万马齐喑”来形容。但文心一言的意义就在于,它是目前全球唯二开发给公众的多模态大型语言模型,也就是说除了ChatGPT、就只有文心一言了,而谷歌的Bard在出道即“翻车”后几乎就没了下文。


显然,千鸟在林,不如一鸟在手,文心一言解决的是有和无的问题,更是国内科技企业从0到1的突破。

文心一言的优势就在于,如今对于国内市场来说,ChatGPT、乃至微软的New Bing理论上是不可用的,它是中国用户当下唯一的选择,并实现了有条件的垄断。一旦提到垄断,资本市场对于科技企业的估值也就有了锚点。说到底,ChatGPT和文心一言这类大型语言模型现阶段都是在“大力出奇迹”,接下来的工作就是扩充语料库、再进行RLHF调优来增强性能了。


基于人类反馈的强化学习(RLHF)是ChatGPT得以“起飞”的秘密武器,而RLHF则是强化学习(RL)的一个扩展,它能够将人类的反馈纳入训练过程,为机器提供一种自然的、人性化的互动学习过程。用ChatGPT自己给出的解释,就是与传统的RL方式相比,RLHF的优势在于能更好与人类的意图保持一致,允许机器掌握明显嵌入人类经验中的决策要素,从各种类型的反馈中进行流畅的学习,并根据需要对反馈进行整理。

所以RLHF的加入,就是ChatGPT比它的前辈们更有“人味”的关键。然而RLHF并非OpenAI的独门绝技,而仅仅是LLM领域的新训练范式。比如斯坦福大学的团队就基于Meta开源的LLaMA大模型,在仅花费了100美元的前提下,就做出了比肩GPT-3.5的Alpaca,并且不需要显卡,在智能手机、乃至树莓派上都能实现本地部署。


所以现在的情况,就是OpenAI的ChatGPT已经完成“暴霜露、斩荆棘”,证明了这一条路是可行的,但他们背后有大金主微软,其他投资者想要插一手只能苦于缺乏渠道。可现在百度用文心一言证明了自己,所以就必然会赢得二级市场的青睐。虽然当初选择“All in AI”的百度还没能等到自动驾驶的商业化落地,却等来了ChatGPT带来的这场东风,冥冥中仿佛一饮一啄、莫非前定。