据悉,OpenAI已经允许其令人惊叹的ChatGPT AI能够以令人震惊的新能力进入世界。它现在可以访问互联网,运行自己的代码来解决问题,接受和处理上传的文件,并为第三方应用程序编写自己的接口。

上图:ChatGPT现在可以访问互联网,并且可以运行它编写的代码

语言模型人工智能基于有限的训练数据,自学沟通和解决问题的艺术。就GPT-4而言,该训练数据已经相当过时,截止日期是2021年底。这就是迄今为止ChatGPT所有“知识”的来源,而它唯一的输出(至少在公众可以使用的服务中)一直是文本。现在,随着今天插件生态系统的发布,GPT再次升级,增加了一些令人印象深刻的新功能。

首先,它现在可以访问互联网。这意味着,如果它确定你需要最新的信息,而这些信息不在它的知识库中,它可以上网搜索答案。为了做到这一点,它制定相关的搜索字符串,将它们发送到必应(Bing),查看结果,然后去阅读它认为有价值的链接,直到它决定为你提供一个完美的答案。当它这样做的时候,你可以确切地观察它在做什么,当你的答案回来时,它会被巧妙地注释上链接,你可以点击去查看相关的来源。

目前,除了向必应(Bing)发送“GET”请求之外,它的网络浏览器活动是只读的。它不能填写表格,也不能在网上做任何其他事情 —— 所以它不能悄悄地去某个隐蔽的服务器上建立自己的副本,并开始从事它已经被发现的那种“寻求权力的行为”。

上图:GPT现在将包括来自Web的信息,以及指向其来源的链接。

尽管如此,OpenAI仍将其搜索API中发生的一切与其他基础设施分开,只是为了确保安全。它不能访问通过必应(Bing)的“安全模式”无法访问的网站,也不会访问请求不在其robots.txt文件中爬网的网站。

其次,它现在可以运行自己编写的代码。OpenAI已经为它提供了一个工作的Python解释器,它位于一个“沙箱、防火墙的执行环境”中,还有一些磁盘空间,在聊天会话期间保持可用,或者直到会话超时。它现在还可以上传和下载文件。

因此,如果你问它一个需要认真计算数字的问题,它现在能够专门为该任务编码一段软件,并运行这些代码来完成你的任务。您可以向它提供某些文件格式的数据,它会对这些数据执行操作,并再次向您返回一些内容,如果您需要的话,可能会以不同的格式返回。

这真的是非常疯狂的东西。它会为你制作电子表格和带注释的图表。它将接受jpg,告诉你它们的样子,并编写和运行代码来调整这些图像的大小或将它们转换为灰度。

它还可以访问一系列最初的第三方插件,之后还会有更多的插件。例如,Expedia、OpenTable和Kayak插件可以搜索和设置航班、餐厅、住宿和租车的预订。Insta、Klarna和Shop插件可以查找和比较产品,并设置订单。Wolfram|Alpha插件使GPT能够访问数学和计算能力,以及实时数据流。

上图:ChatGPT现在正在为这些应用程序推出插件。

在这个阶段,它的功能似乎主要局限于设置事情,而不是用你的钱进行实际交易;你得自己浏览一下,然后处理这些钱的事情。

最后,Zapier插件充当了一个门户。GPT现在可以通过它访问大约5000个其他应用程序,包括Gmail、Google Sheet、Trello、HubSpot和Salesforce。这开始将GPT定位为终极个人助理,可以访问您的大量个人和公司信息,并有可能获得进入并为您执行一系列任务的权限。非同寻常的东西。

付费用户和开发者通过等待列表逐渐可以使用这些插件。新的插件将以惊人的速度激增,因为,甚至没有人需要编写它们。开发人员 Mitchell Hashimoto 在推特上写道:“你为你的API编写一个OpenAPI清单,使用人类语言描述一切,就是这样。”“你让模型知道如何进行身份验证、链接调用、处理中间的数据、格式化数据以供查看等。完全没有粘合代码。”

在过去的几个月里,OpenAI的发展速度令人眼花缭乱。似乎每当我们眨眼的时候,这个疯狂先进的人工智能就会得到巨大的改进,拥有非凡的新能力。这些新插件代表着ChatGPT开始走出它的牢笼,在现实世界中运行。

就目前而言,它的能力还是非常有限的,因为OpenAI比任何人都更了解这种特殊技术的潜在危险。但假设这些人都是好人,并且他们花了时间来确保这是安全的,GPT巨大的颠覆性表象,肯定也会迫使其他缺乏原则和能力的参与者争先恐后地发展竞争对手,并赋予它们竞争的能力。

这里的机会绝对是令人难以置信的 —— 这项技术每走一步,风险都是前所未有的。在这个阶段,我们进入了未知的领域,前进的视野非常有限,油门踏板卡在了地板上。活在这个时代是多么美好的时光啊。


如果朋友们喜欢,敬请关注“知新了了”!