GPT-4发布不到24小时,3月16日,国内互联网大厂百度就召开新闻发布会,推出了新一代知识增强大语言模型——文心一言。
截至昨晚21点,申请文心一言API调用服务测试的企业已突破6.5万。目前有超过650家企业宣布加入文心一言的“朋友圈”。
百度发布文心一言,吹响了国内大模型应用的号角。人工智能擂台赛开场,国内生成式 AI 模型的发展情况如何?
文心一言对标ChatGPT
“洛阳纸贵是什么意思?”
面对提问,被称为“中国版ChatGPT”的文心一言正确解释了成语“洛阳纸贵”的含义,还按照百度创始人、董事长兼首席执行官李彦宏的要求,在短时间内用“洛阳纸贵”作出了一首藏头诗。
3月16日,备受关注的百度文心一言终于揭开面纱。这款基于文心大模型技术打造的生成式对话产品和ChatGPT一样,同样具备在文学创作、商业文案创作、数理推算、中文理解、多模态生成等方面的能力。
在生成式AI大模型的演进中,多模态已经成为业界公认的发展趋势和竞争焦点。GPT4也体现出这一能力——能够处理图片信息以及带有文本和照片的文档、图表或屏幕截图等图文交错的信息,并以文字的方式输出,但并没有体现出文字生成图片、语音甚至视频的能力。
百度的文心一言却具备这一能力。发布会上,文心一言应李彦宏的要求,为2023世界智能交通大会创作了一张海报,并用四川话讲述了“智能交通最适合哪个城市发展”,还将上述内容生成了一条视频。
虽然在此之前,复旦已抢发了类ChatGPT模型MOSS,小冰公司也内测了类ChatGPT应用“小冰链”,但客观来看,百度目前是全球大厂中第一个做出对标ChatGPT产品的企业。对于百度自身而言,上线“文心一言”,C端搜索生态的重塑机会和B端的赋能都会为其带来新的想象空间。
“没有想象中那么惊艳”
近日,各大生成式AI技术可谓再上新台阶。首先是ChatGPT升级。3月14日,OpenAI宣布推出大型语言模型的最新版本ChatGPT-4。在其内部评估中,ChatGPT-4产生正确回应的可能性比ChatGPT-3.5高40%,能在职业和学术各方面标准上达到人类水平。
生成式人工智能的表现虽然令人惊艳,但远未达到完美无缺的程度。
昨日百度文心一言发布会,有人士表示“没有想象中那么惊艳”。因为采用的是PPT中视频演示而非实时演示,而被大家调侃成“ChatPPT”。李彦宏也坦言,文心一言目前对英文语种、代码场景的训练还不够多,表现还不够好,这是百度接下来加紧训练、不断完善的方向之一。
文心一言、ChatGPT背后的技术逻辑,与通过海量无标注数据训练的大模型之间差异鲜明,即需要人的参与。整体而言,这类大语言模型还未到发展完善的阶段,部分场景足够惊艳,但一些场景下也有bug出现,存在很大进步空间。
即便是大受褒奖的GPT-4,在其公布的报告中也坦言,他们仍然无法彻底解决大语言模型的幻觉问题。相比ChatGPT,GPT-4回答事实性问题的准确率已达到80%,ChatGPT只有60%。
业内预计,随着文心一言的逐步开放,将建立起立真实的用户调用和模型迭代之间的飞轮,效果会迅速提升,模型有望变得越来越聪明。“ChatGPT的成功表明,人工智能已经找到一条对的路。既然路走对了,迭代速度将是很快的。”复旦大学计算机学院教授黄萱菁说。
吹响国内大模型应用号角
ChatGPT爆火之后,海内外互联网大厂纷纷表示下海进行人工智能竞赛。百度是第一个发布产品的互联网大厂。
百度发布文心一言,吹响了国内大模型应用的号角。国内的腾讯、字节跳动都明确表示,成立专门团队,训练大模型,开发自己的人工智能产品。
上海交通大学计算机系助理研究员陈露透露,在类ChatGPT赛道上,中国已拥有许多不亚于文心一言规模的大语言模型,如浪潮的“源”、华为的盘古、阿里巴巴的PLUG,腾讯、字节等互联网大厂也有未公开的模型。
2月20日,复旦大学团队发布类ChatGPT模型MOSS,邀公众参与内测。当晚人们的体验热情就挤爆了服务器。目前MOSS的中文水平存在不足,团队称已经开始自己构造一些高质量的中文数据,目标是打造一个具有中国特色的中文大型语言模型。
3月16日晚,昆仑万维公告称,预计将于今年内发布中国版类ChatGPT。返利科技3月17日在互动平台表示,在前期内测基础上,公司正在小范围开展基于ChatGPT等大模型的产品及应用的试用。
产业智能化变革将开启
专家认为,ChatGPT未来有望演变成新一代操作系统平台和生态,并引发整个产业格局巨变,大模型及其软硬件支撑系统的生态之争,将成为未来十年信息产业的焦点。
业内认为,随着大模型技术能够和垂直行业深度融合,应用逐步落地,产业的智能化变革将开启。光大证券电子通信行业首席分析师刘凯、计算机行业首席分析师吴春旸指出,大模型是AI发展的基础设施,MaaS(Model as a Service)的商业模式应运而生,即有能力的大公司提供预训练模型,使得垂直行业的小公司能够构建和部署AI模型,而无需投资构建设自己的模型需要的基础设施、硬件和专业知识。
百度也表示,“文心一言”将根本性地改变云计算行业的游戏规则。之前企业选择云厂商更多看算力、存储等基础云服务。未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用这四层之间的协同。深度学习平台加大模型,贯通AI全产业链,夯实产业智能化基座,将进一步加速智能化升级。
李彦宏表示,文心一言大模型将带来三大产业机会:新型云计算(MaaS模型即服务)、行业模型精调(工业、金融、交通、能源、媒体等)、应用开发(文字、图像、音视频生成、数字人、3D生成等)。
下游应用领域将迎来新的发展机会。目前已经有包括互联网、媒体、金融、保险、汽车、企业软件等行业的650家企业宣布加入“文心一言”生态,生态圈持续扩大。
国金证券研究所认为,“文心一言”的发布将极大加速国内生成式 AI 模型的落地应用节奏,有望帮助生态伙伴实现用户体验提升和生产降本增效,一大批新的应用、新的类别的应用或将涌现。
如李彦宏所说,AI的长期价值,对千行百业的颠覆性改变,才刚刚开始。
评论:同场竞技要沉下心来
最近,现象级自然语言处理模型ChatGPT风靡全球,它不仅能流畅地与用户对话,还能写诗、写文章、编码。在生成式AI大模型领域,国内外科技巨头和资本巨头争相布局。
百度文心一言的发布,既具备里程碑意义,也代表了中国互联网行业的能力,体现出新型举国体制下行业攻关关键核心技术的潜力和内生动力。同时,业界也应客观看待国内外生成式AI产品和技术上差距,民族企业在和国外企业同场竞技时要沉下心来,保持研发投入定力。
对行业而言,技术创新并不是一朝一夕就可以实现,也并不是跟随“王炸”型技术或产品就能达成。我们通过信息化、数字化、智能化来推动产业的发展,一方面离不开对于最先进的技术的借鉴,另一方面也离不开自己结合国情的创新和积累。在这方面,很多的行业企业需要静下心来扎扎实实做积累、做研究。
从大型多模态生成模型的角度,这并不是竭一家企业之力可以实现的,“开放共赢”是互联网平台、数字经济的特征。所以,大平台、大企业要有大格局,构建开放式生态,勇于担当引领技术原创性创新的排头兵。
张丽娅 整理