据《麻省理工学院科技评论》透露,OpenAI 现在将把其图像制作程序 DALL-E2 出售给翘首以盼的百万用户。



自从 2022 年 4 月的邀请制发布会以来,约有 10 万人体验了 OpenAI 的 DALL-E2 软件。如今,这家总部位于旧金山的公司将把该软件向 10 倍于这个数量的人群开放,因为它准备把这个人工智能软件变成付费服务。



OpenAI 的产品与合作关系副总裁彼得·韦林德(Peter Welinder)说:“我们收获的关注与兴趣比预期的要高很多,甚至比 GPT-3(OpenAI 的人工智能自然语言模型,译者注)要多得多。”



付费客户现在可以将他们用 DALL-E 创建的图像用于商业项目中,比如儿童书籍中的插图、电影和游戏中的艺术概念图,以及营销手册的艺术图等。但该付费产品的发布,也将是该公司以此为首选路线推广其强大人工智能模型需要面临的最大考验,即分阶段向用户发行,并在问题出现后及时予以解决。





DALL-E 测试版订阅并不贵:15 美元可以为你购买 115 个积分,你可以使用 1 个积分向这个人工智能软件提交一个文本命令,它会一次性返回四张图片。换句话说,花费 15 美元你可以得到 460 张图片。



除此之外,用户们在第一个月会获得 50 个免费积分,之后的每个月会获得 15 个免费积分。不过,由于用户通常一次生成几十张图片,而只保留最好的那些,因此重度用户可能很快就会耗尽这个额度。



在这次产品发布之前,OpenAI 一直在与早期的用户合作,以进行该工具的故障排除。第一波用户产生了源源不断的超现实且令人震撼的图像:混搭风格的可爱动物们,以惊人准确性模仿真实摄影师风格的照片,用于餐厅和运动鞋设计方面的情绪板(即汇集了各种色彩、图形等视觉元素的某种拼贴画,译者注)。



这使得 OpenAI 能够探索这个软件工具的优缺点。OpenAI 的产品经理乔安妮·姜(Joanne Jang)说:“他们给了我们许多高质量的反馈。”



OpenAI 已经采取措施来控制用户可以制作的图像类型。例如,人们不能生成带有知名人物的图像。在这次商业发布的准备阶段,OpenAI 就已经解决了早期用户标记的另一个严重问题。



4 月份发布的 DALL-E 版本经常反映出明显的性别和种族偏见,比如首席执行官和消防员的图片都是白人男性,教师和护士都是白人女性。



7 月 18 日,OpenAI 发布了一个修复方案。现在,当用户要求 DALL-E2 生成一个包含一群人的图像时,这个人工智能软件会基于某个样本数据集进行绘图, OpenAI 声称这个数据集更能代表全球多元化。根据 OpenAI 自己的测试,用户报告 DALL-E2 输出的图片涵盖多元化背景人群的可能性是之前的 12 倍。



下图(推特截图)是迈克尔·格林在 2022 年 6 月 30 日用 OpenAI 的 DALLA E2 进行的实验,他使用逼真的人工智能模型模仿了知名肖像摄影师多萝西娅·兰格的风格。





这是一个必要的解决方案,但却是一个肤浅的办法。OpenAI 通过筛选过滤用户能提出哪些要求,或者删减屏蔽底层模型产生的内容,以此来解决其用户标记的许多问题。但它并不是在解决模型本身或模型训练所需的数据中的问题。尽管这种方法使 OpenAI 得以快速解决问题。但对一些人来说,这相当于贴上了一个创可贴。



“算法模型中的社会偏见问题是巨大的,”伦敦经济学院的朱迪·瓦克曼(Judy Wajcman)说,她也在图灵研究所从事数据科学和人工智能领域的性别问题方面的研究。“(OpenAI 把)很多精力都投入到技术修复上,我称赞所有这些努力,但它们并不是解决这个问题的长久之计。”



OpenAI 表示,为解决 DALL-E2 的性别和种族偏见而进行的工作给了它们着手全面启动该项目的信心。然而,这并不代表该项目已经一锤定音。人工智能中的偏见是一个有害而且棘手的问题,随着新问题的出现,该公司将不得不继续进行“打地鼠游戏”般的修复。OpenAI 表示,只要产品需要调整,他们就将暂停推广。



韦林德说,这是一种权衡之举。这些调整有时会以意想不到的方式限制用户创作的内容。例如,当 OpenAI 首次发布针对性别偏见的修复方案时,一些用户抱怨说,他们现在有了太多的女版超级马里奥的图片。这种情况很难预测,韦林德说:“看到人们试图用 DALL-E2 来创作什么内容,可以让我们对模型进行微调和校准。”



但是,监控由 100 万或更多用户产生的数亿张图像将是一项艰巨的任务。韦林德不愿透露需要多少人工审核员,但他们将是内部员工。



该公司采用了一种混合的审核方法,结合了人工判断和自动审查。韦林德说,团队的组成可以根据需要进行调整,比如增加更多的审核员,或调整人类干预与机器干预之间的平衡。



2022 年 5 月,谷歌展示了自己的图像制作人工智能 Imagen。与 OpenAI 不同,谷歌很少提及其对这项技术的计划。”关于 Imagen,我们还没有任何新消息可以分享 re,”谷歌发言人布莱恩·加布里埃尔(Brian Gabriel)说。



当 OpenAI 于 2015 年成立时,它被塑造为一个纯粹的研究实验室,对通用人工智能抱有信仰,并承诺确保该技术将造福人类——如果它真能实现的话。但在过去几年里,它已经转向成为一家产品公司,向付费客户提供其强大的人工智能模型。


"这仍然是同一愿景的一部分,韦林德说:“将我们的技术作为一种产品和大规模推广应用是我们使命的关键一环。趁着风险还不算太高,尽早围绕着技术的可用性和安全性进行产品迭代是非常重要的”


支持:王贝贝

参考资料:

https://www.technologyreview.com/2022/07/20/1056238/openai-product-launch-dall-e-million-customers-ai-bias/