去年11月30日,美国OpenAI正式对外发布智能聊天程序ChatGPT,截至今年2月,这款软件在全球狂揽1亿名用户,成为历史上增长最快的消费者应用程序。
3月15日,GPT-4模型正式发布,再次刷新了人们对AI的认知。
次日下午 2 点,在百度北京总部,文心一言由李彦宏亲自对外发布,现场没有进行实机测试,而是用一段视频来展示文心一言的功能。
但就在发布后没几天,文心一言的文生图功能就遭到质疑,许多网友认为该功能并非自主作画,而是靠外国平台生成,是“套壳”“画皮”“造假”。
对此,百度于3月23日回应:文心一言是百度完全自研的大语言模型。
3月25日,李彦宏在作客极客公园的直播时表示,事实上如果全面来评测的话,文心一言确实也不如现在最好的ChatGPT 版本,但是差距不是很大。所谓不是很大,可能就是一两个月的差别。
山东商报·速豹新闻网 记者 吴绍博
“史上功能最强大模型”
3月15日,GPT-4模型正式发布,OpenAI老板Sam Altman直接开门见山地介绍说:“这是我们迄今为止功能最强大的模型!”
据OpenAI官方介绍,GPT-4是一个大型的多模式模型,可以接受图像和文本输入,输出文本,在各种专业和学术基准上表现出人类水平的性能。
比如模拟律师考试,GPT-4取得了前10%的好成绩,相比之下GPT-3.5是倒数10%。
做美国高考SAT试题,GPT-4也在阅读写作中拿下710分高分、数学700分(满分800)。
不少人在尝试新版本之后表示,它比早先大家使用的ChatGPT的GPT-3.5强悍了一大截,再次刷新了对AI的认知。
GPT-4增强了高级推理和处理复杂指令方面的能力,另外,它还具有更多的创造力。OpenAI给出了几个使用范例,如说明图片的内容、分析图表、解答图片内的考题、找出图片不寻常的原因等。
在OpenAI官方发布的视频中,GPT-4通过草图,识别出了这是一个关于网站的草图,然后“顺手”生成了建成这个网页的全部代码,只需几秒,一个网站就做好了。
更有意思的是,GPT-4的读图能力还能读懂人类的幽默。官方示例显示,在输入一张画有VGA线连接手机充电接口内容的图像后,GPT-4除了能描述出这幅图中的内容,还能指出这张图有哪些不对劲,“这幅图中的幽默来自将一个大的过时的VGA连接器插入一个小的现代化的智能手机充电端口。”
此外,微软在第一时间宣布旗下的Bing Chat已经升级使用了OpenAI提供的GPT-4技术,将办公全家桶Microsoft 系列进行智能升级,该技术主要运用于工作场景,被嵌入能够帮助用户生成文档、电子邮件以及幻灯片等,堪称打工人的福音。
作图被质疑“套壳”的文心一言
与备受称赞的GPT-4模型比,文心一言的日子有点不太好过。
在文心一言的发布会上,李彦宏亲自在视频中做出了相应的展示,包括使用文心一言生成文本、图片、音频、视频等功能。
日前,有网友发文质疑,百度文心一言作画,实质上是“把中文句子机翻成英语单词,拿去用国外刚刚开源的人工智能Stable Diffusion生成了图画,再返给你,说是自己画的。”
该网友举例称,在文心一言输入指令,要求其画“鼠标和总线”,文心一言作出的画是“老鼠和公共汽车”,因为“鼠标”和“总线”对于的英文是“mouse”和“bus”。
3月23日,百度方面在其官方微博发布声明回应称,已注意到对文心一言文生图功能的相关反馈。百度称,文心一言完全是百度自研的大语言模型,文生图能力来自文心跨模态大模型ERNIE-ViLG。
与此同时,百度表示,在大模型训练中,百度使用的是互联网公开数据,符合行业惯例。大家也会从接下来文生图能力的快速调优迭代,看到百度的自研实力。“文心一言正在大家的使用过程中不断学习和成长,请大家给自研技术和产品一点信心和时间,不传谣信谣,也希望文心一言能够给大家带来更多欢乐。”
在此前文心一言的发布会上,李彦宏除了反复强调市场对于文心一言的需求,也在反复提及它的“不完美”,试图降低一些市场预期。
李彦宏也坦言:“也不能说我们完全ready了,文心一言对标ChatGPT,甚至是对标GPT-4,门槛是很高的。”他承认文心一言与ChatGPT之间的差距,在差距之下依旧推出,是因为“市场有需求。”
上线一个多月以来,文心一言的文生图功能创造了巨大流量,堪称网红AI。
有网友表示,但随着时间的推移,文心一言的画风逐渐跑偏,从一个人工智能,变成了搞笑画手。
百度“文心一言 搞笑”词条,累计共有7610万个结果。
有网友晒出,要求文心一言画一个胸有成竹的男人,该软件花出一个身上插着竹子的硬汉。
要求画鹅毛大雪,AI画出的是一只鹅站在雪地上。
要求画驴肉火烧,AI画出的是一只驴在火上烤,等等诸如此类。
甚至还有网友利用文心一言画了个杜甫很忙系列,引来无数流量。
有业内人士表示,文心一言目前的作画能力,可以简单概括为逐字作画,因此,智能化程度还是有待提高。
从文心一言的表现看,某种程度上它具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性,都逐渐接近人类水平。但整体而言,这类大语言模型还远未到发展完善的阶段,它们有时候会有很惊艳的表现,但不少场景下,细究起来还有明显的Bug,进步空间很大。
绝大多数网友还无法体验
自3月16日上线以来,国内的许多网友都希望可以体验一下百度的文心一言,但目前依然有很多网友打开文心一言官网看到的还是您已在等待体验中,加入成功将短信通知。
对于该程序何时可以大规模投放市场,以及未来是否会对用户进行收费等问题,记者于近日向百度在线网络技术(北京)有限公司相关邮箱发送邮件询问,截至发稿,该公司尚未回复。
虽然个人用户目前还难以体验,但是,文心一言却拥有数量庞大的企业朋友圈。
在3月16日文心一言发布会当天,百度宣布截至当晚,百度智能云已经与5家企业完成首批签约合作,并与650家企业启动签约。截至3月16日21点,申请文心一言API调用服务测试的企业已突破6.5万。
中国社会科学院新闻与传播研究所所长胡正荣认为,接入像百度文心一言等技术应用,对主流媒体发展而言是一个很好的智媒化发展前提条件。“进入Web3.0时代,互联网发展进入新阶段,传媒行业也步入由数据化和智能化主导的全媒体传播体系建设阶段。AIGC的引入,对主流媒体而言可让内容生产变得唾手可得。同时还可以让生产出来的产品样态更加多样化和复杂化,实现精准化传播。”
除外部企业外,百度旗下的许多企业也第一时间接入。度小满于今年2月份就宣布成为百度文心一言首批生态合作伙伴。度小满称将基于自身金融场景积累的海量对话及解决方案数据,融合“文心一言”的全面能力,打造全新的智能客服、智能营销、智能风控服务。这标志着对话式语言模型技术在国内金融场景的首次落地应用。
度小满CTO许冬亮认为,ChatGPT所依托的大模型的基底是语言生成模型和语义理解模型,它的语义生成空间非常大,如果将它的能力放在金融行业中去处理原有的任务,性能和效果将会有显著的提升
有业内人士认为,随着对数据的解读能力的提升,新技术可以帮助发现原来发现不了的风险,提升金融风控效率;更长远来看,生成数据也将弥补金融数据稀缺问题。