OpenAI的病毒人工智能聊天机器人ChatGPT现在可以浏览互联网——在某些情况下。
OpenAI今天推出了ChatGPT插件,通过授予机器人访问第三方知识源和数据库(包括网络)的权限来扩展机器人的功能。OpenAI表示,在推出更大规模的API访问之前,它将首先优先考虑其高级ChatGPT Plus计划的一小部分开发人员和订阅者。
最有趣的插件是OpenAI的第一方网页浏览插件,这使得ChatGPT能够从网络上提取数据,以回答向其提出的各种问题。(此前,ChatGPT的知识仅限于2021 9月前后的日期、事件和人员。)该插件使用Bing搜索API从网络上检索内容,并显示其在起草答案时访问的任何网站,引用ChatGPT's回复中的来源。
与静态训练数据集相比,实时网络的策划程度更低,当然,过滤程度也更低。谷歌(Google)和必应(Bing)等搜索引擎使用自己的安全机制来减少不可靠内容上升到结果顶端的机会,但这些结果是可以被利用的。它们也不一定代表整个网络。正如《纽约客》上的一篇文章所指出的,谷歌的算法优先考虑使用加密、移动支持和模式标记等现代网络技术的网站。因此,许多拥有优质内容的网站在混乱中迷失了方向。
这使搜索引擎在数据上拥有很大的权力,这些数据可能会为网络连接语言模型的答案提供信息。谷歌被发现在搜索中优先考虑自己的服务,例如,用谷歌位置的数据回答旅行查询,而不是像TripAdvisor这样更丰富、更社交的来源。与此同时,搜索的算法方法为不良行为者打开了大门。据《纽约客》报道,2020年,Pinterest利用谷歌图像搜索算法的一个怪癖,在谷歌图像搜索中展示了更多内容。
OpenAI承认,启用网络的ChatGPT可能会执行所有类型的不良行为,如发送欺诈和垃圾邮件,绕过安全限制,通常“增加欺诈、误导或虐待他人的不良行为者的能力”。但该公司也表示,它已经“实施了一些由内部和外部红队告知的保障措施”来防止这种情况的发生。时间会证明它们是否足够。
除了网络插件之外,OpenAI还为ChatGPT发布了一个代码解释器,为聊天机器人提供了一个可工作的Python解释器
许多早期合作者为ChatGPT构建了插件,以加入OpenAI自己的插件,包括Expedia、FiscalNote、Instacart、Kayak、Klarna、Milo、OpenTable、Shopify、Slack、Speak、Wolfram和Zapier。 它们在很大程度上是不言自明的。例如,OpenTable插件允许聊天机器人在餐厅中搜索可用的预订,而Instacart插件允许ChatGPT从当地商店下订单。到目前为止,Zapier是这群应用中扩展性最强的,它可以与谷歌表单、Trello和Gmail等应用程序连接,以触发一系列生产力任务。
为了促进新插件的创建,OpenAI开源了一个“检索”插件,使ChatGPT能够通过用自然语言提问来访问文件、笔记、电子邮件或公共文档等数据源中的文档片段。
OpenAI在一篇博客文章中写道:“我们正在努力开发插件,并将其带给更广泛的受众。”。“我们有很多东西需要学习,在每个人的帮助下,我们希望建造一些既有用又安全的东西。”
To foster the creation of new plugins, OpenAI has open sourced a “retrieval” plugin that enables ChatGPT to access snippets of documents from data sources like files, notes, emails or public documentation by asking questions in natural language.
“We’re working to develop plugins and bring them to a broader audience,” OpenAI wrote in a blog post. “We have a lot to learn, and with the help of everyone, we hope to build something that is both useful and safe.”
Plugins are a curious addition to the timeline of ChatGPT’s development. Once limited to the information within its training data, ChatGPT is, with plugins, suddenly far more capable — and perhaps at less legal risk. Some experts accuse OpenAI of profiting from the unlicensed work on which ChatGPT was trained; ChatGPT’s dataset contains a wide variety of public websites. But plugins potentially address that issue by allowing companies to retain full control over their data.