GitHub 和 OpenAI 推出了名为 Copilot 的新 AI 工具的技术预览版,该工具位于 Visual Studio Code 编辑器内并自动完成代码片段。
根据 GitHub 的说法,Copilot 所做的不仅仅是模仿以前见过的代码。相反,它会分析您已经编写的代码并生成新的匹配代码,包括之前调用的特定函数。该项目网站上的示例包括自动编写代码来导入推文、绘制散点图或获取 Goodreads 评级。
根据 GitHub 首席执行官 Nat Friedman 的博客文章,它最适合与 Python、JavaScript、TypeScript、Ruby 和 Go 配合使用。
GPT-3 的后代
GitHub 将此视为结对编程的演变,即两个程序员将在同一个项目上工作,以发现彼此的错误并加快开发过程。对于 Copilot,这些编码员之一是虚拟的。
该项目是微软向 OpenAI 投资 10 亿美元的第一个重大成果,OpenAI 目前由 Y Combinator 总裁 Sam Altman 领导。自从 Altman 上任以来,OpenAI 已从非营利状态转向“利润上限”模式,接受了微软的投资,并开始授权其 GPT-3 文本生成算法。
Copilot 基于一种名为 OpenAI Codex 的新算法构建,OpenAI 首席技术官 Greg Brockman 将其描述为 GPT-3 的后代。
GPT-3 是 OpenAI 的旗舰语言生成算法,它可以生成有时与人类书写难以区分的文本。它之所以能够写出如此令人信服的内容,是因为它拥有 1750 亿个参数,或者是可调节的旋钮,允许算法连接字母、单词、短语和句子之间的关系。
GPT-3 生成英语,而 OpenAI Codex 生成代码。 OpenAI 的一位代表表示,OpenAI 计划在今年夏天晚些时候通过其 API 发布 Codex 版本,以便开发人员可以利用该技术构建自己的应用程序 边缘 在一封电子邮件中。
Codex 接受了从 GitHub 获取的数 TB 公开可用代码以及英语示例的训练。
虽然网站上的评价对 Copilot 所提供的生产力提升赞不绝口,但 GitHub 暗示,并非所有使用的代码都经过了错误、不安全做法或个人数据的审查。该公司写道,他们已经安装了一些过滤器来防止 Copilot 发出攻击性语言,但这可能并不完美。
Copilot 的网站称:“由于底层技术的预发布性质,GitHub Copilot 有时可能会产生不需要的输出,包括偏见、歧视、辱骂或冒犯性的输出。”
鉴于对 GPT-3 偏见和滥用语言模式的批评,OpenAI 似乎还没有找到一种方法来防止算法继承其训练数据中最糟糕的元素。
该公司还警告说,该模型可能会建议电子邮件地址、API 密钥或电话号码,但这种情况很少见,而且已发现这些数据是合成的或由算法伪随机生成的。然而,Copilot 生成的代码很大程度上是原创的。 GitHub 进行的测试发现,只有 0.1% 的生成代码可以在训练集中逐字找到。
这并不是第一个尝试自动生成代码来帮助辛苦程序员的项目。初创公司 Kite 推出了非常相似的功能,可在超过 16 个代码编辑器上使用。
目前,Copilot 处于受限技术预览阶段,但您可以在该项目的网站上注册以获得访问它的机会。