凭借ChatGPT掀起人工智能(AI)应用热潮的OpenAI发布了最新作品——GPT-4。得到这种新模型支持的ChatGPT将迎来升级。

美东时间3月14日周二,OpenAI宣布,推出大型的多模态模型GPT-4。它可以接收图像和文本输入,输出文本,将能够更准确地解决更难的问题。

微软此后表示,新款的必应(Bing)搜索引擎将运行于OpenAI的GPT-4系统之上。

上周,微软德国的CTO Andreas Braun在出席德国一个AI活动时透露,本周将发布多模态的系统GPT-4,它“将提供彻截然不同的可能性,比如视频”。这让外界猜测,GPT-4应该能让用户将文本转换为视频,因为他说该系统将是多模态的,也就在暗示,不仅能生成文本,还会有其他媒介。

本周二OpenAI介绍的GPT-4的确是多模态的,但它能融合的媒介没有一些人预测的多。OpenAI表示,GPT-4能同时解析文本和图像,所以能解读更复杂的输入内容。

在下面的示例中,我们可以看到GPT-4系统如何应答图像输入内容,比如像以下截图那样解释图片的不同寻常之处、解释图片的幽默之处、设计一个搞怪图片的用意。