“十月怀胎,一朝分娩”。3月16日下午,百度正式对外发布官宣已久的文心一言。百度创始人李彦宏亲自展示了文心一言的五大能力:“文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成”。 “文心一言对标ChatGPT、甚至是对标GPT-4,门槛是很高的我自己测试感觉还是有很多不完美的地方。”

据悉,3月16日起,首批用户即可通过邀请测试码,在文心一言官网体验产品,后续将陆续开放给更多用户。此外,百度智能云即将面向企业客户开放文心一言API接口调用服务。

《科创板日报》记者获悉,发布会后一小时内,排队申请文心一言企业版API调用服务测试的企业用户已达3万多家

但较为遗憾的是,百度此次在发布会现场并未使用现场实时演示,而是采用提前录制好的演示视频进行了文心一言的能力展示。该产品发布后,百度集团股价出现持续下挫,截至收盘跌幅达6.36%。

▍文心一言未进行"现场答题"

在现场,百度主要展示了在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。

在文学创作方面,李彦宏与文心一言进行了六轮对话,包括让其从哲学角度来续写三体小说的核心内容。

李彦宏还在现场演示了商业文案创作方向的能力,比如为公司起名字、写宣传语、写新闻稿等。在数理逻辑推算任务上,李彦宏演示了文心一言回答逻辑思维领域的经典题目“鸡兔同笼”。

就在百度发布文心一言的前一日,OpenAI刚刚发布了其大型语言模型的最新版本——GPT-4。GPT-4是一个大型多模态模型,支持图像和文本输入,再输出文本回复。

在现场,李彦宏也演示了一段多模态生成方向的Demo,包括创作海报、用四川话阅读文字内容,并自动生成相关内容的视频。

不过,在演示过程中,不少网友吐槽其所有的问答像是先录好的视频,而非实时交互,甚至有网友戏称其为“ChatPPT”。对此,李彦宏也承认,文心一言现场回答的问题实际上是提前录制好的视频,这是为了保证演示效果

“自己测试(文心一言)感觉还是有很多不完美的地方。” 李彦宏在会上坦言。

《科创板日报》记者从接近百度的人士了解到,其实包括百度内部包括技术团队对于这么快推出文心一言,并不是没有不同意见,但看到ChatGPT推出后带来的轰动与商机的李彦宏,坚持要求火速推进并尽快推出,并亲自领军和监控项目进展。

对于为何要加快发布文心一言,李彦宏今天的说法是,因为市场有需求

“百度的很多产品,从搜索到智能云,再到自动驾驶,到小度,大家都有需要,更重要的是我们的客户需要,合作伙伴需要,从我们承认文心一言的存在到现在,短短一个月的时间,就有超过650家合作伙伴宣布加入文心一言生态,大家都希望能早一点用上最新最先进的大语言模型。”

▍文心一言将全面嵌入百度产品线

此前,李彦宏内部信中介绍,百度计划将多项主流业务与文心一言整合,包括与文心一言与搜索整合,将引领搜索体验的代际变革;文心一言将通过百度智能云对外提供服务,根本性地改变云计算市场的游戏规则;此外,文心一言大模型还将搭载到Apollo智舱系列产品,并与小度进行集成。

有接近百度的人士告诉《科创板日报》记者,王海峰作为百度首席技术官,是公司人工智能体系总负责人,也是文心大模型的统管者。百度目前拥有的最先进英伟达A100芯片群,也是大部分优先供文心一言项目使用。

《科创板日报》记者获悉,在研发过程中,文心一言被作为内部高度保密项目,成了专门的封闭开发小组。“其他部门难以接触到,也不让对外透露任何相关的消息。”

一位熟悉百度的人士告诉《科创板日报》记者,文心一言首先会进入到搜索场景之中。“通过提供更好的搜索体验,全新的交互方式、聊天互动体验,以及深层次的内容,来扩大搜索的服务场景和市场规模。百度希望创造下一代互联网新的流量入口。”

在ChatGPT爆火后,微软已将其接入旗下的搜索引擎必应(Bing),还将整合OpenAI的技术宣布推出Azure OpenAI服务,Azure全球版企业客户可以在云平台上直接调用OpenAI模型,包括GPT、Codex和DALL.E模型。

参考微软近来的举措,百度如无意外也会将其类ChatGPT技术作为平台对外开放,供第三方开发应用。

《科创板日报》记者从知情人士处获悉,文心一言的服务也计划在百度智能云上线,预计时间可能在今年5月份左右。通过在百度智能云上提供对外的服务接口,供一些核心用户使用

在自动驾驶和智能交通场景,百度会在通用大模型的基础上,建立交通行业大模型,从而在智能信控、智慧高速等场景形成特有的解决方案。

此外,百度系产品以及相关生态公司,比如百度地图、Apollo、小度、爱奇艺等,都已经开始启动全面接入文心一言的能力。

▍距离GPT-4有多远?

当前,OpenAI的API难以直接面向中国用户/企业开放,这为国产版ChatGPT留足了机会。

但在《科创板日报》记者的采访中,目前,不少业内人士保持谨慎态度。

一位国际知名厂商的搜索引擎领域专家对《科创板日报》记者直言,“目前可能还是做不出来同等的水平,达到GPT3模型水平的有,但关键在于Chat没有,交互对话存在很高的技术壁垒。

除百度外,阿里、腾讯、360等公司也都在类ChatGPT、AIGC技术上有布局。此前360表示,公司的类 ChatGPT 技术的各项指标只能达到略强于GPT-2的水平,与当前的 ChatGPT相比尚有技术代差。

对此,红点中国相关负责人指出, “要追赶这些先进模型,国内需要投入大量资源和精力,包括人才、财力、算力等方面的投入。同时,还需要解决语言模型训练中的技术难点,如中文的数据准备、大规模集群算力的搭建、模型训练的速度和效率、模型的可解释性等问题。”

另有科技业内人士分析称,国内在ChatGPT上落后的原因,是前两年把资源更多地放在产业互联网和B端业务,涉及的是产业端的小模型,而没有把精力放在面向C端的通用人工智能,导致错失了时间窗口机遇。

某接近百度的人员认为,“底层的transformer模型已经出来多年,很多大厂也大多围绕这样的路线来演进,严格来说,GPT并非底层模型的颠覆性创新,更多的是非常巧妙地结合了语义的理解、生成、交互相结合的方式,再加上人类反馈的强化学习,然后实现了这样一个惊人的效果。”

某涉足大模型领域的相关人士对《科创板日报》记者表示,类GPT的路线此前各家都在研发,但没想到还是国外第一个做出来,现在大家也铆足劲在追赶。“从差距来看,个人觉得没有那么大。”

专家:“文心一言”应在OpenAI短板领域弯道超车

面对市场关切,李彦宏把百度竞争的独特优势总结为,在芯片、框架、模型、应用4个层面,都有领先产品,“在全球范围内,这样的公司可以说是绝无仅有,百度就是唯一”。

在看完文心一言发布会后,上海市人工智能行业协会秘书长钟俊浩在接受《科创板日报》记者采访时表示, 相较同业公司,百度的集成优势确实明显,但同时也要看到,在每个层面,其产品能力是否都达到了最好。

在OpenAI已经形成“暴力的算力美学”标杆之下,钟俊浩认为,短时间内,在大模型层面去做超越已经不可能,“也没必要”。对于百度,乃至更多中国的大模型企业而言,更多可以在OpenAI的短板领域弯道超车。

浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员盘和林也表达了同样观点。

他认为,当前ChatGPT的强大是有目共睹,但在中文领域ChatGPT的成熟度略低,“文心一言”的优势是中文,这是ChatGPT的短板;另一优势是易得性,国内ChatGPT使用难度较大。但百度在算法、算力、数据也有短板,算法的问题是积累不够,数据的问题是质量不高,算力的问题是投入不够,这些在未来通过长期积累有可能改善。

值得注意的是,在本次发布会上,李彦宏重点提及了大模型时代的三大商业机会:第一是未来云计算业务,主流商业模式从IaaS变为MaaS(模型即服务);第二是行业模型精调业务,即通用大模型和各行业之间的中间层模型;第三是应用开发,如文字生成、图像生成、音频生成、数字人等。李彦宏认为,在人工智能时代,一定会出现杀手级的应用。

钟俊浩认为,国内企业的弯道超车也就是在这三个层面上体现,比如行业模型精调,不在于比拼整个大模型,而是在细分领域把某一行业模型做大做强,形成优势。

盘和林也表示,百度的优势是商业路径丰富,比如小度智能音箱,就是个很庞大的入口级应用,但当前文心一言面临的是一个强大的对手,一步到位追平的难度很大。但借助中文和应用易得性两项,百度应该会有个不错的开始,但维持优势、提升应用广度还需要很长时间。