北京时间3月16日下午2点,百度正式发布了自己的大模型文心一言。

发布会由百度李彦宏和cto王海峰亲自上场,足见百度对这场发布会的重视。不过整场发布会下来,内心也由如过山车一般,待我心绪经历了一个晚上才冷静下来。

本文从以下几个方面介绍和分享

  1. 百度ai领域的投入和优势
  2. 百度大模型的研发情况
  3. 文心一言发布会关键信息
  4. 对于语言 大模型行业竞争的看法

百度在ai领域投入和优势:

百度的强项在信息检索,信息检索是和大数据处理紧密相关的,对于在ai领域的投入和应用,百度有着先天优势。

百度一直是中国领先的互联网公司之一,但在过去很长一段时间因为检索广告和信息误导等原因,在大众中的口碑不佳。不过让广大网友赞赏的国内互联网公司又有几家,这的确是很有意思的一个现象。

抛开这些因素不谈,百度在人工智能领域拥的投入还是相当执着,Robin多年前一句 all in ai,也一直是业界的谈资,但这么多年下来,百度在ai相关领域的投入和决心一直没有变动过,百度的研发投入占营收比例,多年来也一直是国内科技巨头中排名第一。如今,百度在信息检索,移动生态,百度智能云,智能汽车等主要业务领域中,ai都在起着关键作用。也包括在当前火热的语言大模型领域,百度已经做了很长时间的探索和准备。也是因为chatgpt的成功,让产业界看到了大模型的价值,百度更应大力推进语言大模型的商业化进程,以抢占国内的竞争身位。

百度ai的应用情况:

自然语言处理(NLP):百度在中文NLP领域有很高的影响力,其自然语言处理技术已经被广泛应用于搜索、语音识别、机器翻译等领域。百度NLP的应用还包括智能客服、智能写作、智能教育等。

语音技术:百度在语音识别、语音合成等领域也拥有较强的技术优势。2017年,百度的语音合成技术Deep Voice 可以让机器模拟出不同年龄、性别、说话方式的人类声音,引起了广泛的关注。

计算机视觉(CV):百度在计算机视觉领域的研究也非常活跃,拥有很多优秀的研究成果。百度在人脸识别、图像搜索、图像识别等领域都有很强的技术优势。

推荐算法:百度的推荐算法也是其技术优势之一。百度的推荐算法在搜索、资讯、电商等场景中得到了广泛应用,推荐效果很不错。

智能驾驶:百度在智能驾驶,智能交通领域也是业界领先的企业,百度丛2012年左右开始,经过了十多年的发展,做到了全球领先的水平,这个可以查看我之前的文章,guidehouse insights 对于全球领先智能驾驶公司的排名。

总之,百度在AI领域的投入和技术优势都非常强大,其在NLP、语音、CV、推荐算法等方面拥有领先的技术水平,并且已经将这些技术应用到了搜索、智能驾驶、智能家居、智能客服等众多领域。

当然我们也要看到国内公司的不足,中国的公司在创新方面与国际领先水平特别是美国的一些公司有着明显差距,有大量的外部环境和历史因素,暂且不表。但对如今世界来讲,科技创新和应用推广是平行流动的,这里面更加关键的是自身的营商环境。所以对于一个有确定性未来的产品应用,中国公司有着自身的发展优势,不过内卷也是中国一大特色。

这些题外话回头再聊,我们接着说百度语言大模型的情况:

丛现有的公开材料和发布会的情况来看,百度在2019年的时候就已经开始陆续发布相关的大模型应用。丛最早的文心ERNIE 1.0版本首个知识增强大模型,到后来的ERNIE3.0 首个知识增强百亿参数大模型,性能一路飙升,也在各种场合打榜上榜。

除了知识增强大模型外,还有Plato,ERNIE-UNIMO,ERNIE-VIL,GLUE, ERNIE-DOC,ERNIE-VILG等等不同版本的大模型,已经广泛应用在各行各业,我理解这也是百度发布会上体现出来的超过650家伙伴战略合作的来源。

回到发布会本身,不得不说过程还是很让人失望。虽然我对百度在ai语言大模型上的能力没有太多怀疑,但是发布会这种PPT宣讲的形式,让人不免侧目。搞了这么大的营销阵仗,小板凳和西瓜都准备好了,就给我看这个???

股票市场倒是很配合,开始以后,直接来了个10米跳台,一度突破十个点。

发布会情况简述如下:

  1. 百度在AI领域是全栈投入,全球仅此一家,丛芯片到框架,丛模型到应用,你需要啥我都有。
  2. 百度大模型的积累和应用已经有很多年了,与大量的企业伙伴已经在紧密协作。
  3. 百度深耕国内市场,基于海量的知识库,中文理解全球独一份,最棒。
  4. 文心一言文学创作、商业文案创作、数理推算、中文理解、多模态生成等样样皆通,通过录制好的demo样例给大家瞅瞅。
  5. 基于ai的开发测试部署应用,百度全栈工具链,让你迭代效率飞起来。
  6. 文心一言主要擅长讲中文,中国方言也可以,外语不太熟练,和友商比有差距。
  7. 文心一言还不是特别成熟,当前阶段只接受受邀测试,普通群众还需要等待些时日。

对于这次没有现场实测,众多吃瓜群众表示不满,但是在gpt-4的余威下,谁能幸免,google,facebook,百度还有谁?

当然发布会后超过3万家企业用户提交了试用申请,百度云的流量一度报表,手速快的体验报告反馈使用效果很好,或许是降低了期待以后,大家更容易满足了吧,哈哈哈

当前业界对于语言大模型的期待过热,而这又是一个需要长期坚持奋斗的赛道,大家多点耐心,比赛才刚刚开始。对于比赛经验丰富,身体又结实的大厂高富帅而言,open ai抢跑不算啥,等我调转炮口。

一枝独秀不是春,百花齐放春满园。Openai撕开了赛道垂幕,语言大模型将会爆发出无穷的力量,为科技圈带来一片新天地,一场新的盛宴已经开始。

前段时间有文章说到为什么欧美的ai比我们强,提到了欧美的精英教育和我们的功利教育,得出结论我们先天不如人,后天也不如人。这着实让我匪夷所思,也让我耳边响起那句古话-王侯将相宁有种乎