据《华尔街日报》10日报道,在距离3月16日百度计划发布类似ChatGPT的聊天机器人“文心一言”仅余一周时间之际,这家中国搜索引擎巨头的员工们表示,他们正抓紧赶在最后期限前完成开发工作,目前这款聊天机器人的一些基本功能尚未完善。
据知情人士透露,为了开发这款名为“文心一言”(英文名“Ernie Bot”)的人工智能(AI)聊天机器人,数百名员工一直在夜以继日地工作。员工们表示,公司已经从其他团队借调人手和功能强大的计算机芯片来支援“文心一言”的开发工作。
《华尔街日报》援引知情人士的说法称,在预定的发布日期之前,这款聊天机器人所基于的AI模型仍在接受数据训练。而听取过相关简报的信息人士透露,百度计划分阶段推出该产品,首先向部分用户开放进行公测。
百度公司首席执行官(CEO)李彦宏 图源:视觉中国
百度公司表示,已经与400多家中国公司签署了协议,这些公司将能够在其产品和服务中使用“文心一言”。反过来,这款聊天机器人能够通过在不同场景下的运行积累经验,这将有助于其性能的提高。
《华尔街日报》报道称,多年来,百度在开发大语言模型方面投入巨大,以将此类模型的英文版本改造以适用于中文,大语言模型是聊天机器人的基础技术。百度2019年发布了其开发的第一款模型,并将其命名为“文心”,英文名为“Ernie”。此前谷歌公司将其模型命名为“Bert”。Ernie和Bert都是美国儿童益智节目 《芝麻街》(Sesame Street)中的角色。
据《上海证券报》此前报道,2022年9月,百度公司首席执行官(CEO)李彦宏判断人工智能发展在“技术层面和商业应用层面,都有方向性改变”。据推测,百度那时就开始做“文心一言”。今年2月7日,百度内部人士向记者确认,百度将于今年3月推出相关产品。
根据 《华尔街日报》看到的一份内部文字记录,去年12月下旬,李彦宏向员工谈到了这项新的开发工作。他当时表示:“我们有这么酷的技术,那我们能不能把它变成人人都需要的产品?”李彦宏还说:“这一步其实才是最难的,也是最伟大、最能够产生影响力的。 ”
据熟悉该项目情况的消息人士称,今年1月初,公司高管让百度自然语言处理部的团队开始用“文心”模型整合出一款对标ChatGPT的产品。 但这些消息人士说,与其他从事类似ChatGPT技术的AI开发者所遇到的情况一样,这一项目面临挑战。
其中一个挑战是,需要教会这个模型对有着多种含义的短语或可以指代多人的名字进行辨别,从而对用户的要求作出更精确的回应。另一个挑战是让“文心一言”聊天机器人生成的语句看起来更像是真人说的话。第三个挑战是提高事实准确性,而这是大语言模型本身的一个技术限制。大语言模型会根据不同词语可能同时出现的概率将句子串起来,而并不是根据信息片段。这些消息人士说,百度公司已经聘请更多员工来帮助评估和改进这款聊天机器人给出的回答。