当OpenAI在2022 年11月下旬零声张地推出ChatGPT 时,这家总部位于旧金山的人工智能公司没有抱太大期望。当然,OpenAI内部的任何人都没有为病毒式的巨大成功做好准备。从那以后,该公司一直在努力追赶并利用其成功。
在 OpenAI 从事政策工作的桑迪尼·阿加瓦尔 (Sandhini Agarwal) 表示,它在内部被视为“研究预览”:对一项已有两年历史的技术的更完善版本的挑逗,更重要的是,它试图解决一些问题通过收集公众的反馈来发现其缺陷。“我们不想夸大它是一项重大的基础性进步,”从事 ChatGPT 工作的 OpenAI 科学家利亚姆·费杜斯 (Liam Fedus) 说。
我的感受是,OpenAI 仍然对其研究预览的成功感到困惑,但已经抓住机会推动这项技术向前发展,观察数百万人如何使用它并试图解决最糟糕的问题向上。
自去年11 月以来,OpenAI 已经多次更新ChatGPT。研究人员正在使用一种称为对抗训练的技术来阻止 ChatGPT 让用户欺骗它做出不良行为(称为越狱)。这项工作让多个聊天机器人相互对抗:一个聊天机器人扮演对手并通过生成文本来攻击另一个聊天机器人,迫使它打破通常的约束并产生不需要的响应。成功的攻击被添加到 ChatGPT 的训练数据中,希望它学会忽略它们。
OpenAI 还与微软签署了数十亿美元的协议,并宣布与全球管理咨询公司贝恩结盟,后者计划在其客户(包括可口可乐)的营销活动中使用 OpenAI 的生成人工智能模型。在 OpenAI 之外,关于 ChatGPT 的热议引发了围绕大型语言模型的另一场淘金热,全球的公司和投资者都参与其中。
在短短的三个月内,这是很多炒作。ChatGPT 从何而来?OpenAI 采取了哪些步骤来确保它已准备好发布?他们接下来要去哪里?
Jan Leike:老实说,这让人不知所措。我们很惊讶,我们一直在努力追赶。
John Schulman:在发布后的几天里,我经常查看Twitter,有一段疯狂的时期,提要充满了 ChatGPT 屏幕截图。我期望它对人们来说是直观的,我期望它会获得追随者,但我没想到它会达到这种主流流行程度。
Sandhini Agarwal:我认为有多少人开始使用它,这对我们所有人来说绝对是一个惊喜。我们在这些模型上工作了很多,我们忘记了它们有时对外界来说是多么令人惊讶。
Liam Fedus:我们对它的反响如此之好感到非常惊讶。之前对通用聊天机器人的尝试太多了,我知道可能性不大。然而,我们的私人测试版让我们相信我们拥有人们可能真正喜欢的东西。
Jan Leike:我很想更好地理解是什么推动了这一切——是什么推动了病毒式传播。就像,老实说,我们不明白。我们不知道。