目前,百度已经官宣“文心一言”,表示将在今年3月完成内测并向公众开放;阿里达摩院类ChatGPT产品已处于内测阶段;京东云将推出产业版ChatGPT—ChatJD……2月20日,小冰公司的ChatGPT应用“小冰链(X-Chain of Thought & Action)”也开启了小范围内测,成为又一个可供试用的中国造ChatGPT。

那么,小冰链(X-CoTA)有哪些新特性?与ChatGPT相比有何差异?小冰公司CEO李笛在接受央广网记者采访时表示,“此次短暂演示小冰链的新特性,使AI Being不只是给你回复,而是将她的思考过程完整透明地呈现在你面前,揭开大模型的黑盒。更重要的是,她能真正实施某种行动(Action)。”

小冰链不再只是“聊天”

可完全展示思考过程

记者进入“小冰链”内测系统后,页面有一个类似于搜索引擎的输入框,其响应反馈速度比手机人工智能助手更敏捷。值得一提的是,在反馈答案时,不仅会显示结论,还能完全展示整个思考过程。

(截图自小冰链内测系统)

例如,输入近期的新闻热点“如何评价江西的天价彩礼事件,应该接受它是一种风俗吗?”小冰链通过发现天价彩礼的相关新闻报道和信息后,最终得出结论:“江西的天价彩礼不应该被接受,应该加强监管,维护社会公平正义。”

(截图自小冰链内测系统)

再如,输入“从北京到苏州相当于跑了多少个马拉松?”最终的结论是:“相当于29.2个马拉松。”显然,小冰链(X-CoTA)完成了直接准确的回答,并且将思考过程和证据都透明的展现出来。

(截图自小冰链内测系统)

通过多次测试,目前反馈效果比较好的测试句式有:“如何评价XXXXX”,“你觉得XXX怎么样”,“如何看待XXXXX”,“XXX和XXX哪个更好”,“XXXXXXXX,你是什么看法”等。

比如上述输入的“《肖申克的救赎》这部电影怎么样,里面有哪些经典情景让你印象深刻?”给出的回答就比较好;但如果问,“《肖申克的救赎》这部电影怎么样?”这个问法就太宽了,出来的结果就不如前面的。可见,问题越具体、越新鲜,呈现的效果就越好。

很显然,小冰链的内容生成逻辑是,在你提出问题后,她经过思考,发现自己得去搜索一下,或是实时编写一段代码并真的加以运行,或是自主决定她应当控制物理世界的一系列设备或交通工具,来更好地满足你的需求。

李笛告诉记者,小冰链所代表的方向,是利用大模型技术,实现下一代的控制中枢。通俗来讲,这使小冰不再只是“聊天”,而是在“逻辑思维”驱动下的“下一代行动中枢”,覆盖数字和物理世界。这一方向将成为下一个真正带来影响的大模型创新突破。

勿做“刻舟求剑”式竞赛

需探寻大模型创新突破

日前,北京市经济和信息化局发布的《2022年北京人工智能产业发展白皮书》明确提出,支持头部企业打造对标ChatGPT的大模型,着力构建开源框架和通用大模型的应用生态;加强人工智能算力基础设施布局;加速人工智能基础数据供给。

事实上,小冰链并非小冰在大模型时代的唯一创新。

自2014年以来,小冰始终伴随技术迭代而成长,经历了检索模型、生成模型、大模型和X-CoTA等多个周期。其中在大模型领域,自2019年至今,小冰已经形成了不同规模的模型训练和调优,并在安全性评估之后依次放出。小冰链只是其中之一。

李笛认为,“大模型的安全性和伦理仍是至关重要的考量因素。”因此,尽管国内市场非常火爆,但小冰团队不会为了秀肌肉而贸然放出各种不安全的产品,这次的小冰链是唯一的一次例外。

(分别在X-CoTA和ChatGPT上搜索同样的问题)

那么,小冰链相较于ChatGPT有何优势?据李笛介绍,小冰链是实时获取信息的,ChatGPT是从训练数据中总结;小冰链的逻辑思维过程更透明可观测,而ChatGPT是个黑盒子。最本质的区别是,小冰链是有行动,例如去外部搜索;ChatGPT是只说(对话生成),并没有行动。

此外,小冰链所解决的其他问题还包括:解决大模型训练数据更新不及时的问题,并提高回复的准确性和可信度,使信息可溯源;有效降低参数规模和成本,促进普及等。

在李笛看来,“跟随ChatGPT做军备竞赛是刻舟求剑。”因为大模型技术本身正在快速发展,应当进一步去布局下一站的未来,而不是照抄当前的ChatGPT。换言之,应当去思考ChatGPT之后的是什么,而不是做中国的ChatGPT。