Image

Image

OpenAI 正式发布 GPT-4,具有多模态能力。3 月 15 日,OpenAI 正式发布了 GPT-4 预训练大模型,相比于 GPT-3.5 性能表现显著提升,在一些专业和学术领域上已经达到了人类水平,是 OpenAI 在人工智能领域的又一里程碑。GPT-4 具有一定的多模态能力,能够接收图文结合的输入,并输出文本回复。

GPT-4 对图片的处理分析能力达到了很高的水准,这相当于机器拥有了视觉并且能够进行思考,在应用层面有非常广的空间,比如在教育领域,GPT-4 可以直接对以图像输入的题目进行求解;在机器人领域,GPT-4 有望成为机器视觉的核心中枢能力。

下载链接:

1、GPT-4技术报告(英)-OpenAI(2023)

2、GPT-4技术报告(中)-OpenAI(2023)

《GPT-4技术及报告合集》1、GPT-4震撼发布,AI算法之巅 2、OpenAI发布GPT-4,大模型发展进入新的里程碑 3、OpenAI:GPT-4技术报告

GPT-4 能够进行长文本处理和创造性输出,能够自定义对话风格,相比 ChatGPT更加可靠安全。GPT-4 可以处理超过 25000 字的长文本,支持内容创作、对话拓展和文档分析等功能,其优秀的创造性可以辅助用户进行创意工作,例如创作歌曲、编写剧本或学习用户的写作风格。用户能够自定义 GPT-4 对话交互的风格,打造个性化的 AI,对基于 GPT-4 的二次开发来说非常方便。与 ChatGPT 相比,GPT-4 的逻辑推理能力更进一步,在复杂的推理问题中表现更佳,并且大幅减少了错误回答和敏感内容的生成概率,可靠性与安全性有了较大改善,但仍存在提升空间;

GPT-4 开放 API 使用申请,成本较 GPT-3.5-Turbo 涨幅较大。目前仅有 ChatGPTPlus 的订阅会员用户能够访问 GPT-4,OpenAI 未来可能会推出免费的 GPT-4 试用版和更高级的订阅版本。OpenAI 同时开放了 GPT-4 API 的使用申请,会逐步邀请开发人员开始试用 API。目前提供给开发者的 API 只能进行文本的输入,最便宜的8k-prompt 版本的定价为 0.03 美元/1k tokens,相比于之前发布的 GPT-3.5-turbo 要贵十倍以上。

GPT-4 有望带来多场景智能化变革。OpenAI 给出了 GPT-4 的 6 个应用实例,涵盖了教育、金融和政府领域。微软也在 GPT-4 发布后官宣,New Bing 背后的模型就是 GPT-4,并且将随着 GPT-4 的更新持续迭代,微软在 3 月 16 日的线上活动中将有望发布基于 GPT-4 的新 Office,带来办公场景的智能化变革。基于 GPT-4 对话交互的特性,我们认为,GPT-4 将率先在教育、医疗、企业经营管理办公等领域实现落地,场景与人工智能的结合方式值得期待。

据 OpenAI 显示,GPT-4 和 GPT-3.5在一些普通的谈话测试中的性能区别不大,但是在处理较为复杂和专业的任务上,GPT-4 相比GPT-3.5 则表现更优。在美国律师资格考试测试中,GPT-4 的成绩可以达到前 10%,而 GPT-3.5只能达到后 10%的水平。与 SOTA 模型(state-of-the-art model,目前最好的模型)相比,GPT-4 也展现出了更好的性能。

Image

GPT-4 是一个多模态模型,它能够接受图片和文本输入,并输出文本回复。与业界之前的预测不同,GPT-4 并不具备多模态的生成能力,即无法从文本输入中得到图片(类似于 DALL-E),只能对图片的输入进行分析,并且图片输入目前仍处于研究预览阶段,还未对公众开放。根据 OpenAI 显示,GPT-4 对图片的处理分析能力达到了很高的水准,这相当于机器拥有了视觉并且能够进行思考,在应用层面有非常广的空间。比如,完全可以成为视力障碍人群的眼睛,在教育领域也有广泛的落地场景。

Image

伴随着 GPT-4 的发布,OpenAI 也给出了 GPT-4 的 6 个应用实例,涵盖了教育、金融和政府领域。例如在Duolingo 里加入 AI 与用户进行日常聊天,加速用户对语言的学习;摩根士丹利采用 GPT-4 来对其知识库进行管理,帮助员工快速访问想要的内容。微软也在 GPT-4 发布后官宣,New Bing 背后的模型就是 GPT-4,并且将随着 GPT-4 的更新持续迭代。我们在之前的报告中已多次提到,大模型的能力将对产业智能化带来重大影响。随着 GPT-4 的发布以及性能飞跃,大模型在各领域有望迎来进一步的落地应用。

1)教育场景:GPT-4 的自定义 AI 风格能力与其连续对话交互能力与教育场景十分契合,对不同性格的学生采用不同风格的 AI 作为虚拟导师,回答学生的问题、提供个性化的学习建议和教育资源、分析学生的学习进展等,达成对学生进行个性化教育的目标,使得每个学生都能以最大化的效率进行学习。此外,GPT-4 还能作为教师的辅助教学工具,帮助教师更好地管理教学过程和学生。例如,教师可以使用 AI 来分析学生的学习数据,针对不同的学生制定更加个性化的教学计划和评估学生的学习成果。GPT-4 的图片分析能力还能够辅助教学过程中的阅卷工作,实现对主观题的评分,减轻教师工作负担,提高阅卷的公正性与准确性。

2)医疗场景:GPT-4 丰富的专业知识使其能够做好辅助诊断的工作,通过分析医疗记录、病历资料、诊断报告等数据,提供有关疾病诊断、治疗方案和药物处方等方面的建议和指导,帮助医生更加准确地诊断和治疗疾病,提高医疗质量和治疗效果。在医学影像领域,GPT-4 新增的图片分析能力也可以用于CT等图像的诊断,智能标记出存在症状的图像区域。将GPT-4 与可穿戴设备结合,可实现对重症患者的全天候健康监测,进行实时健康风险评估,帮助患者做好健康管理等。

3)企业经营管理办公场景:GPT-4 的对话交互特性与逻辑分析能力可以助力企业经营管理办公全流程的效率提升。在企业的 OA 系统中,GPT-4 可以辅助员工快速智能地进行流程办理;在企业 ERP 系统中,GPT-4 可以通过数据分析来辅助企业进行经营决策;在办公环节,GPT-4 的长文本理解能力有望对会议、文档和邮箱场景带来效率提升。微软将在 3 月 16 日召开线上发布会,有望推出基于 GPT-4 的全新 Office,为办公场景带来新的智能化升级。

下载链接:

1、GPT-4技术报告(英)-OpenAI(2023)

2、GPT-4技术报告(中)-OpenAI(2023)

《GPT-4技术及报告合集》1、GPT-4震撼发布,AI算法之巅 2、OpenAI发布GPT-4,大模型发展进入新的里程碑 3、OpenAI:GPT-4技术报告


本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。

Image

免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。

电子书<服务器基础知识全解(终极版)>更新完毕。
获取方式:点击“小程序链接”即可查看182页 PPT可编辑版本和PDF阅读版本详情。

温馨提示:
请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。
Image
Image