今天下午两点钟,百度举办了文心一言的发布会。帅气的Robin宣布了文心一言正式发布。对于普通大众最关心的在哪里使用?这次也算有了一个比较正式的答复,就是目前是处于邀请测试阶段,普通大众是无法使用的。那大约什么时候能够对普通大众开放呢?整个直播下来完全没有提。

不过从直播现场传达的信息来看,文心一言可能不会非常快地面向大众。首先从演讲的风格上面来看,Robin和CTO都是比较紧张拘谨的,言谈举止之间似乎有一种仓促。连现场文心一言的演示也是录制的视频,并没有真正的进行使用。在CTO讲解的过程中,甚至反复提及这样的大模型的规模化部署会是一个比较大的技术门槛。可见,文心一言很有可能在百度内部根本就没有完成应对大并发的规模化部署。考虑到ChatGPT从首次部署只有很少人使用,到1亿用户,这个过程也用了三四个月。其内部也坦言,这三四个月为了满足大家的访问需求,做了非常多紧急的改进,可以说争分夺秒。那么像百度这种10亿量级的公司,如果发布这样一个产品,恐怕也不是三四个月能够解决的。更何况,百度目前很有可能还没有达到能够部署的阶段。相比ChatGPT的首次发布,百度很可能还在开发阶段。所以如果半年之内都无法见到百度文心一言跟公众见面,我觉得也是不奇怪的。

1

更大的赌局


这场发布会中也并不是没有亮点。Robin先生提出了新时代开发的四层结构,分别是芯片层、框架层、模型层和应用层。百度是全世界唯一一家在这四层结构中,每一层都有非常深的技术积累,而且有领先产品推出的公司。这一点我认为是非常可信的,也确实是百度的一个长期优势。一旦百度在自研的四层架构基础上,完成了类似ChatGPT功能的实现,那么在后面的市场竞争中,它将拥有巨大的成本优势。因为它的每一层之间互相的调优是其他公司无法完成的,类似苹果的软硬件一体系统。如果百度最后真的做到了,那它将成为AI时代中国的另一个华为。

但是独立完整技术栈这种事情,收益大、风险也大。它意味着你基本没有办法去借鉴竞争对手的很多技术手段。你必须在你自己的全套技术栈上面生长出来一个有竞争力的产品,而且是一个难度极大的有竞争力的产品。如果你的这一套技术栈在底层设计的时候有明显的缺陷,就有可能导致你开发到百分之七八十之后,还剩百分之二三十的时候,始终突破不过去,最终导致功亏一篑、满盘皆输。

最终百度是会得到这个时代最大的荣耀,还是被时代的浪潮拍在沙滩上,这个我们拭目以待。(说实话,小编是希望它能做成的。百度能做成对中国是巨大的利好。)

2

方向的担忧


看了这场发布会之后,作为一个看客,小编还是对百度的方向有自己的两点担忧。

第一,百度可能过于着重于中文的文心一言,对英文的关注度不足,同样,对代码的关注度也不足。但是英文的生成非常重要,因为我们不得不承认,世界上最先进的技术,最有生产力的那部分语料是英文的。同样,写代码的人虽然在人群中占比不是很高,但是写代码的人,他在人群中最终的生产力是最高的。ChatGPT 这一类的产品最终对全社会生产力的促进作用是极高的,但是如果文心一言最后出来之后,英文生成效果不好,代码生成效果不好,那它最后的使用价值就要大打折扣了。

第二,百度有可能过于关心各个行业的细分模型了,但是通用大模型不需要细分。在发布会上,无论是Robin还是CTO,反复提到了百度在各个行业领域细分大模型的精细打磨,似乎隐含的让大家去觉得这些细分大模型最终汇集在一起,就会形成一个非常强大的文心一言。但是有没有一种可能,ChatGPT的诞生只是从人类最基础的对语言的理解方式,以及注意力最基础的运作方式出发,去模拟一种最基础的机制。然后配以极大的数据量,极大的运算量,最后通过暴力美学而生成的一种通用大模型。也就是说它本质上是在模拟人的理解能力,跟你具体在哪一个行业没有什么关系。甚至它的很多能力都是在巨大的数据量的训练下涌现出来的,并不是被设计出来的。换句话说,如果我们现在突然多出了一个行业,那么把这个新行业的数据添加到数据集,按照原来的方式训练一遍,它应该也是能够理解这个行业的。但百度这种强调各个细分行业去精磨,就在这里面掺杂了太多的人为调优的痕迹,使得开发出来的最终模型不够那么通用。当然,笔者也是从门外汉的角度去理解这件事情,有专业人士发现这里的理解有错误,欢迎批评指正。

3

输不起的一战


ChatGPT的诞生,几乎等于给Google和百度按下了倒计时键。你不跟吧,等死。如果跟了跟不上,作死。跟了而且跟上了,利润还要大幅下滑。怎么做都难受。但即便如此,这可以说是背水一战了。哪怕公司脱层皮,也得往死里干。

最后我想说,加油,百度,希望你能成功。或者说国内至少要有一两个做通用大模型的团队成功,加油!



如果你想体验 ChatGPT,欢迎使用沃依得学堂的机器人答疑。