GPT-3 是 OpenAI 开发的高级自然语言处理模型。它返回自然语言文本完成以响应任何文本请求,例如短语或句子。开发人员在他们的应用程序中使用 GPT-3(通过应用程序编程 (API) 按需收费)来完成文本翻译和软件代码开发等任务。

OpenAI 最近发布了新功能,允许开发人员创建自己的 GPT-3 版本。新的自定义选项现在在 API 中可用。

GPT-3 只需几个实例就可以执行范围广泛的自然语言任务,这种概念被称为小样本学习或提示设计。GPT-3 可以定制以产生更好的结果,因为它允许用户提供比提示设计允许的更多的实例。

GPT-3 的适应性得益于其独特的架构。AI 基于 Transformer 设计,这是一种创建自然语言处理模型的流行技术。另一方面GPT-3 比通常的基于 Transformer 的神经网络更先进。它有 1750 亿个参数,远远超过同一类别中许多不同的神经网络。这些是控制 AI 如何解释输入的设置。

GPT-3 能够胜任广泛工作的能力也归功于团队对 AI 的训练方式。对从实验室各种来源收集的数千亿个数据点训练了 GPT-3。因此在某些情况下,GPT-3 可以仅从少数几个实例中学习完成新任务。

在将 GPT-3 用于用程序之前,开发人员不需要在大量示例上训练 GPT-3。但是已经注意到增加项目中使用的训练数据量可以显着提高处理精度。OpenAI 新增的 AI 定制能力可以实现这一目标。

开发人员可以使用新功能在特定数据集上训练 GPT-3,以针对特定用例对其进行优化。它还允许开发人员在新信息可用时对 GPT-3 进行训练。例如一家使用 GPT-3 评估客户反馈的公司可能会根据最新的用户想法每周重新训练 AI。

该团队表明对少于 100 个样本的微调可以提高 GPT-3 在某些任务上的性能。提到将样本数量加倍可以线性提高质量。

Viable Inc. 是一家风险投资支持的公司,它正在使用 GPT-3 来支持一项服务,该服务可帮助企业分析消费者反馈并确定最常重复的建议。据 OpenAI 称,Viable 通过新的个性化功能将反馈摘要的准确性提高了 24%。

在自定义数据集上训练 GPT-3 具有潜在降低 AI 费用的额外好处。应用程序必须向 GPT-3 发送一个文本提示,说明应该做什么来完成任务。应用程序提示中的字数决定了 OpenAI 对 GPT-3 的使用收费多少。针对给定用例使用专门的训练数据集定制 GPT-3 可以让 AI 使用更简单的提示和更少的单词来完成任务,从而降低 API 成本。

最新的 OpenAI 版本体现了业界对 AutoML 技术日益增长的兴趣。使用特定的训练数据集来定制神经网络可以带来显着的可靠性增益。

AI 有多种不同的变体,每种都有不同的性能、准确性和成本。OpenAI 还与微软合作创建了 Codex,这是 GPT-3 的特殊版本,为开发人员提供代码完成功能。

获取访问权限:

https://beta.openai.com/docs/guides/fine-tuning/preparing-your-dataset

参考:

https://openai.com/blog/customized-gpt3/

https://venturebeat.com/2021/12/14/openai-begins-allowing-customers-to-fine-tune-gpt-3/

https://siliconangle.com/2021/12/14/openai-rolls-feature-creating-customized-versions-gpt-3/