在过去的几个月,AI 聊天机器人ChatGPT 几乎成为了所有人讨论的焦点,其强大的功能让不少使用者爱不释手。而在3 月14 日,其开发商 OpenAI 宣布,推出最新版大型语言模型「GPT-4」,准确度相较3.5 版本高出40%,并声称该模型能在美国大学的入学SAT测验击败90%人类、并在律师资格考试(Bar examination)击败90%受试者。


那么,GPT-4 到底有什么功能?和ChatGPT 有什么区别?还会闹出乌龙吗?


OpenAI 推出GPT-4,可媲美人类

据CNBC 报导,ChatGPT 开发商14 日在官方部落格宣布推出GPT-4,使用微软(Microsoft)的Azure公用云端服务平台进行训练,跟过去的版本相比规模更庞大。这代表该模型受过更多资料训练、模型档案更具份量,营运成本也更昂贵。

此外,OpenAI宣称,GPT-4在许多专业测试的表现已「可媲美人类」 (human-level performance)。

OpenAI表示,GPT-4生成的答案错误更少、正确性比GPT-3.5高40%,也较不会超脱常轨、大聊禁忌话题,在许多标准化测验的表现甚至比人类优秀。值得注意的是,GPT-3.5及GPT-4闲聊时差别虽不大,但若任务够复杂,GPT-4比GPT-3.5更可靠、有创意且能处理更多微妙指令。

根据OpenAI说法,GPT-4可在律师资格考试击败90%人类、在国际生物奥林匹亚(Biology Olympiad)击败99%高中生。事实上,GPT-4在至少34种涵盖总经、写作、数学等领域的测验皆名列前茅。


GPT-4来了!功能有哪些?怎么用?和ChatGPT有什么区别?

GPT-4 用途一:更强大的语言文字处理能力

根据OpenAI官网上的介绍,GPT-4能够处理多达2.5万字的长篇内容,足足是ChatGPT的8倍以上,无论是生成文本、延伸对话或分析文件,GPT-4都能胜任。

这也代表着GPT-4现在拥有更强悍的「记忆力」。《TechCrunch》认为,GPT-4能够长时间更聚焦地与用户对话,除了提供更精确的回覆、不会偏移讨论主题,过去聊天机器人表现不佳的一大问题原因在于,最刚开始的要求与设定在一定长度的谈话后就会被后来的资讯所覆盖。


GPT-4 用途二:辨识视觉图像的能力,且有一定的「幽默感」

GPT-4还具备分析图像的能力,好比说可以辨识图片中的鸡蛋、面粉、牛奶等素材,推荐用户能够运用这些素材完成的料理。GPT-4似乎还具备了一定程度的「幽默感」,在开发者直播中能够向用户解释哏图的好笑之处。

由OpenAI演示的范例中,使用者丢了一张迷因梗图询问这张图为什么好笑,而GPT-4则一一解析3个区块的内容,并解释其笑点。


GPT-4 用途三:生成网页

GPT-4 还懂得大部分主流的程式语言,能够担任撰写程式的辅助帮手,结合前图像辨识功能, OpenAI更直接拍摄一张手绘的网站草稿,让GPT-4当场生成出整个网站的程式码。

GPT-4 用途四:超强推理能力

与此同时,GPT-4展现了比ChatGPT更强的推理能力,例如在示范中可以依据多位与会者的行程空档,找出众人都有空的时间安排一场会议,甚至参与高难度的文、理科都能名列前茅。

OpenAI的开发团队让GPT-4参加30种以上的考试,大多数的考试成绩都落在前10%的区间,而ChatGPT 使用的GPT-3.5则多半落在40~80%的区间。

OpenAI透露,GPT-4在律师资格考试获得PR 90的成绩,这代表GPT-4表现赢过9成考生;另外,在SAT的阅读测验里则达到PR 93、SAT的数学考试中则得到PR 89的成绩,而生物奥林匹亚里更是达到PR 99,远高于ChatGPT的测试表现。


GPT-4 用途五:强大的语言处理能力,多样的角色与语气

研发团队加强了GPT-4对于其他语言的处理能力,使翻译各国语言的精准度大幅提升。

此外,如果给予GPT-4扮演某个特定角色的指令,要求它以某种语气回应,它将以该风格与你互动。这与微软更新的新bing功能有一些相识之处。