NO.469

百度人工智能文心一言最近饱受质疑。不少用户在使用中发现,文心一言对很多汉语完全是按照字面意思理解,完全牛头不对马嘴。3月22日,微博大V刘大可直接发文表示,经过反复验证,百度文心一言只是把中文句子翻译成英文,再拿到国外开源的人工智能上画图,然后再将图片返还给用户,完全就是个“套壳、画皮、造假”的人工智能。随后,百度回应称“完全自研”。

去年11月30日,美国OpenAI公司研发的聊天机器人程序ChatGPT发布。一经问世就引发现象级讨论,在短短一个月的时间,月活用户就突破1亿,成为史上增长最快的消费者应用,打破了抖音6个月用户破亿的神话。这是一款通过人工智能技术驱动的自然语言处理工具,它能够通过学习和理解人类的语言来进行对话,能像人一样聊天交流,也可以完成写作、视频脚本、翻译、代码等各种任务,被认为是颠覆性的科技创造。

ChatGPT大火以后,今年3月,百度也发布了类似的人工智能机器人文心一言。根据百度的说法,文心一言具备跨模态、跨语言的深度语义理解与生成能力。文心一言有一个AI艺术创意辅助平台文心一格。在好奇心的驱使下,网友们在文心一格上玩嗨了。

但玩着玩着,网友们对文心一言的质疑越来越多。起初,不少用户质疑文心一言不能准确理解很多中文词语的含义,尤其是一些成语。

比如,有网友让文心一言画个鱼香肉丝,结果画出来的作品就是字面理解意思。说明文心一言缺乏对美食的训练。

还有网友让文心一言画的唐伯虎点秋香、胸有成竹、车水马龙等成语或者典故,画出来的作品都是字面意思,与实际意思毫不沾边。

不少用户因此质疑文心一言“段位不高”。

但是,3月22日,微博用户“@刘大可先生”发文质疑,文心一言之所以常常只能根据字面意思给出答案,是因为这个人工智能只是“套壳”的机器人。刘大可还列出了几个正向和反向实验的例子。

比如,让文心一言画“鼠标和总线”,他却给出了“老鼠和公共汽车”的图片,因为老鼠和总线的英文单词分别为“mouse”和“bus”。

再比如,让他画起重机,结果他却给出了一个鹤的画,因为起重机这个词的英文是“crne”,其另一个常用语义就是鹤。说明文心一言就是直接将中文翻译成英文之后,再按照英文给出答案。

让文心一言画一个“土耳其张开翅膀”,结果他画了一个火鸡。

画“水瓜”,他画了个西瓜。

让他画“中国论文”,他画了一个山水画。因为论文的英文是“paper”,但“Chinese paper”是宣纸的意思,所以他画了个山水画来象征宣纸。

此外,还有就是系统默认的问题。如果让画一个人,他会画出白种人,画国旗,如果不加国别,就会画出来星条旗。

刘大可认为,百度的这个人工智能就是把中文句子翻译成英文,然后使用国外开源的人工智能“stable diffusion”生成图画,然后再反还给国内用户。他认为这不是文心一言的储备和训练不够,而是完全使用的国外开源程序改头换面,换壳而已,只是在汉译英过程中出现问题,导致露馅。

也有网友支持文心一言,认为在图库方面,中文资源较少,英文资源较多,而英文图库的标签都是使用英文,百度只是用了国外的开源图库,素材引用而已,并不是代码。

争议面前,观察君也十分好奇,于是亲测了一下。不得不说,百度改进的速度还是非常快的。

起重机、鼠标和总线之类的翻译问题出现的错误,不少已经更改。比如,起重机已经换成了真实的起重机,而不是鹤。

但是关于成语典故等汉语理解问题,错误依然非常多。鱼香肉丝依然还是肉丝的鱼,唐伯虎点秋香还是老虎在烧香。

百度潜心研究人工智能十多年,好不容易做出来一个文心一言,却这样饱受质疑,百度是不能忍的。

面对质疑,百度很快发声。3月23日,百度公开回应称,文心一言完全是自研的语言模型,模型训练素材使用的是互联网公开数据,符合行业惯例。希望大家给自研技术一点时间和信心。

百度这个公开回应,似乎并未正面回应网友质疑,概括成一句话就是,我没有“套壳”。能否解答广大用户心中的疑惑和质疑,那就看大家的理解了。