ChatGPT发布仅四个月后,北京时间3月15日,OpenAI宣布GPT-4正式发布。

OpenAI介绍称,GPT-4是一个大型多模态模型(接受图像和文本输入,输出文本输出),虽然在许多现实场景中不如人类,但在各种专业和学术基准上表现出与人类相当的水平。GPT-4是OpenAI在扩大深度学习方面的最新里程碑。

根据OpenAI总裁和联合创始人Greg Brockman的直播演示画面,GPT-4的页面相比ChatGPT功能更多,左侧的“system”框可用于设定AI身份属性,中间输入框输入问题,右侧可根据提问者需求进行参数设置。

“我们花了6个月的时间使用我们的对抗性测试程序,以及在ChatGPT身上累积的经验教训来迭代调整GPT-4,从而在真实性、可操纵性和拒绝超出设定范围方面取得了有史以来最好的结果。”OpenAI称。

这种差异在GPT-4和GPT3.5模拟考试成绩的比较中显得更为直观,如在一项模拟律师考试中,GPT-4的成绩排名前10%左右,而GPT-3.5的分数在后10%左右;170分的GRE考试科目,GPT-4能以几乎满分的分数通过,比GPT-3.5高出十几分。

不仅如此,GPT-4还解锁了很多GPT-3.5做不到的事,如报税、写诗、写代码等。此外,GPT-4还有了质的飞跃,即能够接受图像作为输入介质,并生成说明、分类和分析。如输入一张食材图问可以用这些食材做什么,GPT-4能识别图中原料并举例可做成的食物;一秒识别手绘网站图片,并根据要求实时生成网页代码,制作出几乎与手绘版相同的网站。

除了普通图片,gpt-4还能处理包括表格、考试题目截图、论文截图、漫画等更复杂的图像信息,如根据专业论文给出论文摘要和要点,读懂梗图中的槽点。

在测试的26种语言中,GPT-4已有24种语言优于GPT-3.5和其他大语言模型的英语语言性能,其中中文达到了80.1%的准确性,比GPT-3.5的英文准确性提升了10%。

由于功能更加强大,运行更加昂贵,GPT-4没有开放免费测试权限,而需每月支付20美元成为会员。

中信证券预计,在GPT-4带动下,未来大模型以及多模态模型的商业化应用将进一步加速,带动行业景气度持续向上。伴随成本下降以及多模态的持续演进,GPT等大模型有望构筑AIGC核心基石,推动AI商业化进程加速和市场天花板打开。

不过值得一提的是,OpenAI强调,GPT-4与早期的GPT模型具有相似的局限性,它仍然是基于2021年9月之前的数据训练的,所以缺乏对现状的有效理解,会大胆编造事实,甚至出现推理错误。因此,在使用时最好辅之以人工审查、附加上下文,并避免在高风险情境中使用。