OpenAI 在周二发布了 GPT-4,这是一个大型的多模态模型(可以接受图像和文本输入,输出文本),它在各种专业和学术的基准测试中展现出了人类水平的表现。

GPT-4 是 OpenAI 在深度学习领域的最新成果,也是其 GPT 系列模型的第四代。GPT 系列模型是基于自然语言处理技术的生成预训练变换器(generative pre-trained transformer),它们可以根据大量从互联网上收集的文本数据来预测下一个词或词片段,并根据用户给出的指令来生成技术或创意作品。

与前一代模型 GPT-3 相比,GPT-4 有了很大的提升和创新。

首先,GPT-4 可以处理图像输入,这意味着它可以根据用户上传的图片来进行推理和描述。

其次,GPT-4 的可靠性、创造力和灵活性都有所增强,它可以处理更复杂和更细致的指令,并在各种场景中给出更合理和更有用的回答。

最后,GPT-4 的规模也比 GPT-3 大得多,它支持生成和处理多达 32,768 个词片段(约 25,000 个单词)的文本内容。

为了验证 GPT-4 的能力,OpenAI 让它参加了一些原本设计给人类考生的考试,并取得了惊人的成绩。例如,在美国统一律师资格考试(Uniform Bar Exam)中,GPT-4 的分数位于前 10% 左右;而 GPT-3.5 的分数则位于后 10% 左右。此外,在法学院入学考试(LSAT)、研究生入学考试(GRE)数学部分、以及各种高级放置课程(AP)科目测试中,GPT-4 都表现出了超越或接近人类水平的水准。

OpenAI 表示,在开发 GPT-4 的过程中,他们重建了整个深度学习系统,并与微软 Azure 公司合作设计了一个专门针对他们工作负载的超级计算机。他们还花费了六个月时间对 GPT-4 进行迭代调整,并借鉴了他们之前发布过的对话机器人 ChatGPT 的经验,在事实性、可控性和安全性方面取得了最佳效果(尽管仍然不完美)。

目前,OpenAI 已经通过 ChatGPT 和 API (需要排队等待)向公众开放了 GPT-4 的文本输入功能。

(8138913)