AI赛道的战争在近几日越发白热化。外界的热情也被GPT-4的进展和百度(BIDU.US;09888.HK)“文心一言”的发布点燃。

3月15日,OpenAI发布了多模态预训练大模型GPT-4。第二天,百度也发布了“文心一言”。

有业内人士对红星资本局表示,文心一言发布当日呈现的能力,无法和GPT-4相提并论,但外界应以包容心态看待,还是要给其较长时间成长。也有专家强调,“不要急着去对标”,技术需要积累,要承认差距,奋起直追。当下国内企业要做的,仍应醉心于技术突破。

大模型产业机会

不光被龙头企业瞄中

和GPT-4一样,文心一言是一个多模态大模型。

发布会上,李彦宏提到了一个词——涌现。有研究表明,数据规模足够大,参数达到千亿级,大模型就可能发生“智能涌现”,即使在没有专门训练过的领域,也能涌现出知识理解和逻辑推理能力。

3月16日,李彦宏在“文心一言”发布会上发言。图据视觉中国

清华大学计算机系教授唐杰曾表示,大模型训练面临着诸多的挑战,训练成本高昂,训练1750亿个参数的GPT-3,用到了上万块英伟达V100GPU(图形处理器),总成本据悉高达1200万美元。人力投入巨大,谷歌PaLM530B团队,前期准备29人,训练过程11人,整个作者列表68人。训练过程不稳定,易出现训练不收敛现象(训练过程中的损失值无明显下降趋势甚至上升),且调试困难。

这也意味着,大模型的赛道只会把握在资源雄厚的大厂手中,创业公司机会寥寥。除了百度之外,阿里(BABA.US;09988.HK)、腾讯(00700.HK)也在意料之中加码。

2月23日晚间,阿里巴巴集团董事会主席兼首席执行官张勇在财报会上表示,目前,云计算和人工智能的结合正处于技术突破和发展的关键时期,生成式AI正在发生颠覆性突破。张勇强调,阿里巴巴将全力构建好自己的AI预训练大模型;2月27日,有消息称,腾讯针对类ChatGPT对话式产品已成立“混元助手(HunyuanAide)”项目组。对此消息,腾讯方面表示,目前,腾讯在相关方向上已有布局,专项研究也在有序推进。

企业之外,地方也在倾力投入。2月13日,北京市经济和信息化局发布的《2022年北京人工智能产业发展白皮书》提出,2023年要全面夯实人工智能产业发展底座。支持头部企业打造对标ChatGPT的大模型,着力构建开源框架和通用大模型的应用生态。

有关大模型的建议在今年两会中也频繁出现。全国政协委员、360集团创始人周鸿祎,全国政协委员、恒银金融科技股份有限公司党委书记、董事长江浩然,全国人大代表、科大讯飞董事长刘庆峰均针对“国产大模型”提出了建议,强调要重视认知智能大模型研发,尽快大力支持国产大模型技术攻关。

AI狂飙

除了大模型,还有哪些机会

发布会上,李彦宏表示,“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。”

AI已成为当下科技领域最火爆的赛道之一。前美团高管王慧文、前京东高管周伯文均在近期宣布奔赴AI大模型领域。华泰证券发布研究报告称,随着国内互联网厂商陆续开展ChatGPT类似产品研发,GPT大模型训练热潮或将带来底层算力需求快速释放。在业内人士看来,各家为了应对这场竞争,似乎都有些急躁,争先恐后推出自家的大模型,但实际上无论是技术、工程还是数据上都和OpenAI有很大的差距。

分析师认为,以GPT模型为代表的AI大模型训练,需要消耗大量算力资源,随着国产大模型开发陆续进入预训练阶段,算力需求持续释放或将带动算力基础设施产业迎来增长新周期。产业链相关公司包括算力芯片厂商、服务器厂商和IDC服务商。

但这股快速强势的资本热情效果如何仍是未知数。“国内生成式AI企业不要盲目地推出对标产品。前车之鉴就是谷歌,在OpenAI推出产品后,谷歌匆忙应战,结果发布会的若干个小瑕疵导致谷歌股价暴跌。”工信部信息通信经济专家委员会委员盘和林对红星资本局表示,国内生成式AI企业要清楚认识到,这一次ChatGPT的成功和过去其他概念有所不同,其成功基础在于用户的认可。也意味着后来者实际上更难做,要求也更高。如果生成式AI方面没有达到ChatGPT的效果,则会暴露自己能力上的短板。

“国内AI企业还是要重视积累,包括参数积累、数据训练积累以及算力积累。科技的道路,弯道超车的机会有,但不多,大多数科技领域开展的是阵地战,要尝试‘结硬寨,打呆仗’的做法,夯实中国生成式AI发展的基础,推出成熟度较高的产品。”

盘和林建议,国内生成式AI企业也可以另辟蹊径,GPT-4并不是万能的,在其短板领域完全可有一番作为。

红星新闻记者 王田

编辑 杨程

(下载红星新闻,报料有奖!)