北京日报客户端 | 记者 孙奇茹

OpenAI近日推出了升级后的GPT-4。从过去只能接收文字输入到可以“读图”,两秒钟就能生成一个网站,在解决数学问题方面的表现也大幅提升……作为ChatGPT背后人工智能大模型GPT-3.5的下一代技术,此次发布的GPT-4能力相比于之前更加强大。

将自己设计的网站草图用笔画下来,再将手绘内容拍照输入系统,GPT-4就可以很快生成一套搭建一个真实网站的代码——在OpenAI的演示中,由于加入了处理图片信息的能力,GPT-4似乎具备了“神笔马良”一般的新体验。

理解能力也实现了进一步提升。在官方提供的示例中,GPT-4针对去年热传的一组图片进行了解读,并指出其中的笑点。

OpenAI发文称,GPT-4虽然在许多现实场景中的能力不如人类,但在各种专业和学术基准测试中已做到人类水平的表现。例如,GPT-4在SAT考试中拿下700分,GRE几乎满分。在高级推理能力上,GPT-4也超越了上一代模型。在律师模拟考试中,GPT-3.5排名在倒数10%左右,而GPT-4考到了前10%左右。

相比于上一代,GPT-4目前还具备了更好的创造性,在创意和技术写作任务中能够与用户一起生成、编辑和迭代“风格”,例如创作歌曲、编写剧本或学习用户的写作风格进行内容生成。

一位在美国当地体验了GPT-4的中国初创公司创始人告诉记者,为了体验GPT-4,他特意升级成了ChatGPT的付费用户,感觉“进入了新世界的大门,它只受你的想象力限制,例如分分钟就能实现一个MUD游戏(多用户虚拟空间游戏)。”

不过,OpenAI对于用户调用GPT-4能力的频率进行了限制。目前如果在使用ChatGPT时如果在模型选择中选了GPT-4,则每4小时限制100条消息,选GPT-3.5则无此限制。

“限制了消息数量就相当于限制了程序的行数,打个比方,乐高积木理论上啥都能搭出来,但只给你100块积木能搭出来的花样就很有限了。”上述人士分析,OpenAI作出这一限制可能是出于算力成本的考虑。

此外,OpenAI向公众演示的图片输入与识别功能目前仍处于测试阶段,并未对外界开放。