21世纪经济报道记者杨清清、实习生赵宇彤 北京报道

自去年年底以来大热的ChatGPT,也在迎来越来越多的竞争者。

2月7日,21世纪经济报道记者从百度方面获悉,百度内部正在进行ChatGPT竞品的上线冲刺,该项目名字确定为文心一言,英文名ERNIE Bot。项目将于三月份完成内测,并面向公众开放。

无独有偶,谷歌也在近期密集披露“类ChatGPT”产品的相关进展。当地时间2月6日,谷歌公司首席执行官桑达尔·皮查伊在一篇博文中宣布了ChatGPT竞争对手Bard,将其描述为“实验性的对话式人工智能服务”。据桑达尔·皮查伊透露,该软件将“在未来几周内更广泛地提供给公众”。

微软更是紧锣密鼓地提速相关应用步伐。近日,微软宣布将ChatGPT整合至全线产品中,并扩大与ChatGPT所有者OpenAI的合作关系。集成了ChatGPT-4的新版Bing(必应)亦曾短暂上线,部分用户提前访问了新版Bing,体验到以聊天方式展示搜索结果的全新搜索引擎。

资料显示,ChatGPT是由美国人工智能公司OpenAI于2022年11月推出的人工智能聊天机器人模型。基于 GPT-3 模型开发,ChatGPT使用大量训练数据模拟人类语言行为,通过语义分析生成文本从而与用户进行自然交互。公开数据显示,截至2023年1月末,ChatGPT的月活用户已经突破1亿,成为史上用户增长速度最快的消费级应用程序。

“尽管当前掀起ChatGPT的热潮,但我们认为短期内ChatGPT对市场影响有限,长期来看这些模型甚至在3年以后会退出市场。”在接受21世纪经济报道记者采访时,IDC中国研究总监卢言霞直言道,“基于ChatGPT可能会诞生一批新创企,但单纯依赖大模型无法为创企提供持续的竞争力。垂直领域的数据、面向场景的模型优化、工程化的解决方案,才是将AI落地的根本,也是建立竞争优势的关键。”

文心一言即将开放

随着ChatGPT热度持续走高,引领全球科技赛道风向,我国科技企业也纷纷入局。

2月1日,便有消息传出,百度将于3月在国内推出类似ChatGPT的智能聊天程序,该消息迅速引爆我国科技行业。截至当日收盘,百度港股股价报收于144.3港元,涨幅达到8.66%。

2月7日,百度方面进一步向21世纪经济报道记者证实,该项目名称确定为文心一言,目前该产品在做上线前的冲刺准备工作。项目将于三月份完成内测,并面向公众开放。

消息一出,百度股价再度大涨。截至港股收盘,百度股价上涨15.33%,收盘价报于162.5港元。百度美股亦于盘前大涨,截至发稿涨幅达到14.65%。

事实上,百度在ChatGPT所在的AIGC领域已有布局。早在去年9月,百度CEO李彦宏就判断人工智能发展在“技术层面和商业应用层面,都有方向性改变”。12月,在一场面向全体员工的内部直播中,李彦宏更是直接提及AIGC(人工智能技术生成内容)与ChatGPT。

“我很高兴我们每天都在琢磨的技术能够吸引这么多人的关注,这并不容易。”李彦宏指出。同时,李彦宏也坦言,技术上已经行至眼前,但是它会变成什么样的产品以及能满足怎样的需求,从链条上而言仍存在不确定性。

今年1月初,百度进一步宣布,百度搜索将升级“生成式搜索”能力,基于百度自研的生成式模型能力,为用户开放式的搜索提问或定制化的信息需求“创作答案”,并指出AIGC和搜索引擎是互补而非替代的关系。

彼时,在接受21世纪经济报道记者采访时,百度搜索杰出架构师辜斯缪透露,百度搜索今年技术上最重要的工作,便是将搜索系统升级为“检索+生成”的双模系统。在他看来,未来信息检索更有可能采用“检索+生成”的模式,搜索将变成跨模态的理解和交互。

“过去搜索都是单元对话式模式,用户提供问题,搜索引擎返回结果。”辜斯缪介绍称,未来该模式有望产生较大的变化,可能呈现多轮交互的形式,且与多轮对话有所区分,“用户可以更高效地对搜索引擎提出需求,它在满足用户需求的同时能够迭代与调整需求。”

而当21世纪经济报道记者问及“百度是否会推出类似ChatGPT”的产品时,辜斯缪也透露百度内部已有类似可用的版本,但无法透露更多的细节。

不过如今,百度文心一言逐渐揭开面纱,并给出具体的时间表。百度方面同时透露,按照谷歌和微软的发布节奏,“文心一言”开放内测还有可能提前。

随着百度相关消息的披露,百度股价也一路走高。据21世纪经济报道记者梳理,自2月1日起至今,百度港股股价一周内累计涨幅已达到22.36%。

国内厂商抢滩

从命名上而言,文心一言延承着百度文心大模型一脉。

资料显示,2019年3月,百度正式推出了文心ERNIE 1.0。作为百度所开发的大模型之一,ERNIE是一种与ChatGPT基础技术类似的深度学习模型。而目前百度所推出的AIGC产品中,无论是产业级搜索系统“文心百中”,还是AI作画产品“文心一格”,都使用了语义理解大模型ERNIE。从命名来看,后者也很可能是“文心一言”所使用大模型。

据百度方面介绍,目前文心系列大模型参数规模达到2600亿,具备跨模态、跨语言的深度语义理解与生成能力,表现超越谷歌的T5和OpenAI的GPT-3,成为全球最大的中文单体模型。

此外,百度亦深耕人工智能技术领域,在人工智能四层架构中拥有全栈布局。除了大模型之外,百度在底层的芯片、深度学习框架以及最上层的搜索等应用均有布局。

除百度之外,国内厂商也在试图抓住ChatGPT带来的热度。2月7日,三六零在互动平台表示,公司的人工智能研究院从2020年开始一直在包括类ChatGPT技术在内的AIGC技术上有持续性的投入。

不过,三六零也坦言,截至目前其相关技术仅作为内部业务自用的生产力工具使用,且投资规模及技术水平与当前的ChatGPT 3相比还有较大差距,各项技术指标只能做到略强于ChatGPT 2。公司也计划尽快推出类ChatGPT技术的demo版产品。

“我看好百度以及相关厂商在国内的布局能力,原因是他们有中文语言优势,有国内领域相关数据积累。”在接受21世纪经济报道记者采访时,卢言霞指出。不过她也强调,国内厂商目前在基础模型及预训练模型方面还有待提升,毕竟这些模型最早源于国际市场。“不过中国厂商投入大,有决心,能获取数据。相信会在特定的场景,各有优势。”

浙江大学国际联合商学院数字经济与金融创新研究中心联席主任盘和林则认为,国内厂商在布局ChatGPT方面面临着算法优化能力有限、算力成本过高、数据质量不好等问题。同国外厂商相比,百度及相关厂商当前算法成熟度依然有一定的差距,具体应用效果要推出之后由用户来验证。

国际厂商竞速

作为中外搜索引擎两大巨头,百度和谷歌不约而同地选择了加速类ChatGPT产品的布局。

当地时间2月6日,谷歌CEO桑达尔·皮查伊在博文中发布竞争对抗ChatGPT的Bard产品。据介绍,Bard是由LaMDA提供支持的全新实验性对话谷歌AI服务,将利用网络信息为用户提供最新、高质量的回复。

这也意味着,不同于ChatGPT受限于2021年以前的数据,Bard能基于实时网络数据回复用户并展开对话。皮查伊表示,“目前已开始部分公开测试,将在未来几周内更广泛地提供给公众。”

据了解,Bard为谷歌公司内部“code red”优先级项目,原计划于2月8日正式发布,提前两天亮相且CEO亲自发文邀请公众测试,足以证明谷歌在与ChatGPT竞争中的坚定态度。

对于微软而言,身为OpenAI多年关系密切的合作伙伴,更是不会错过当前的风口。据报道,微软预计将全线微软产品整合接入 ChatGPT,包括 Office全家桶,新版 Bing 和传统网络搜索引擎。此外,微软还宣布将扩大与ChatGPT所有者OpenAI的合作关系,将向后者进行“多年、数十亿美元”的投资。

事实上, ChatGPT与微软产品的整合并非空穴来风。近日,集成了ChatGPT-4的新版 Bing曾在网页短暂上线。据介绍,新版Bing不再仅仅只是搜索框,而是以聊天的方式展示用户搜索结果。

此外,微软宣布已经上线集成OpenAI的GPT-3.5语言模型的即时通信协作平台Teams,该产品能够提供会议要点总结或翻译等人工智能功能。用户不仅可以使用由GPT-3.5语言模型加持的智慧会议,企业也将可以自定义会议体验来确保私密性。

不过需要注意的是,目前ChatGPT的全球产业市场尚且处于探索阶段。并且,其高昂的成本也是商业化过程中绕不开的命题。在盘和林看来,算力成本和应用普及度都成为制约ChatGPT发展的重要因素。

“运行ChatGPT需要比较高的算力,那也就意味着未来应用会要收费,而收费会让用户兴趣降低。”盘和林指出,“很多算法会选择开源,但开源会限制企业盈利能力,也会限制普及度。”

有业内人士透露,目前ChatGPT一次模型底座的训练需要500万美元的算力成本,一次问答的综合成本大约为0.8美元。这远非初创公司所能承受。

“由于我们对话量太大,按照ChatGPT的成本,一天的成本就要好几亿元。”此前在接受21世纪经济报道记者采访时小冰公司CEO李笛亦称。这也就意味着,即使ChatGPT把成本优化到当前的10%,盈利与成本之间也很难打平。

“这个技术确实很贵,我们在具体落地时也存在许多的优化空间,通过各方面的优化来降低它的单位成本。”辜斯缪向21世纪经济报道记者直言道,目前来看,模型本身的规模以及最终交互的请求量两个核心技术参数,直接影响了生成式搜索的成本,“未来随着技术本身的演进,也会使得模型效率进一步提升。”

除去高昂的成本门槛之外,卢言霞也指出,ChatGPT所提供的答案在准确性、广泛性方面仍存在局限。“因此现阶段无法直接用于企业特定的场景中以替代之前的 AI 应用,不可能彻底颠覆搜索市场,也不可能改变人工智能市场格局。”

更多内容请下载21财经APP