一种新的文本生成语言模型,结合了 Google 自己的 PaLM 模型和一种称为“带有人类反馈的强化学习”的技术,以创建 开源 理论上,该工具可以做 OpenAI 的 ChatGPT 可以做的任何事情。

然而,对于大多数人来说,这仍然是一个理论。与 ChatGPT 不同的是,AI 开发者 Philip Wang 的 掌上型+右耳高频 没有接受模型学习所需的任何文本数据的训练。用户必须编译自己的数据集并使用自己的硬件来训练模型和处理请求。

响应人类输入的文本生成模型,例如 ChatGPT 和 PaLM + RLHF,是人工智能领域的最新热潮。简而言之,他们在从现有数据集中学习语义模式后预测适当的单词,这些数据集可能包括从电子书到互联网激烈战争的任何内容。

创建易于使用的人工智能

尽管 PaLM + RLHF 已进行预训练,但带有人类反馈技术的强化学习旨在产生更直观的用户体验。 

正如所解释的 TechCrunch,RLHF 通过对人类提示产生广泛的响应来训练语言模型,然后由人类志愿者对这些响应进行排名。然后,这些排名用于训练“奖励模型”,该模型按偏好顺序对响应进行排序。

这不是一个廉价的过程,除了最富有的人工智能爱好者之外,这将阻止所有人训练该模型。 PaLM 拥有 5400 亿个必须在数据上进行训练的语言模型组件(或参数),并且到 2020 年 学习 据透露,仅训练一个 16 亿参数的模型就需要花费 8 万到 160 万美元。

现在,我们似乎依赖一位富有的捐助者参与、训练并向公众发布该模型。这样的依赖并没有得到好的结局 ,但其他公司正在努力复制 ChatGPT 的功能并将其作为免费软件发布。

阅读更多

> 立即查看我们的最佳人工智能作家名单

> ChatGPT 之后,谷歌担心自己落后于时代

> ChatGPT 被用来创建恶意电子邮件和代码

研究小组 CarperAI 和 EleutherAI 正在与初创公司 Scale AI 和 Hugging Face 合作,发布第一个经过人类反馈训练的语言模型,该模型可以开箱即用。

尽管还没有完全准备好,但为“机器学习、文本到图像”模型提供训练数据集的公司 LAION 稳定扩散,创建了一个类似的项目 GitHub 它希望通过允许使用 API、编译自己的研究成果并允许用户个性化来取代 OpenAI,同时针对消费类硬件进行优化。