Image

作者 | 刘燕,核子可乐,王强
一夜爆火后,Midjourney遇到成长的烦恼。
AI 图像生成器 Midjourney 
已叫停免费试用

Midjourney 是当下最火的 AI 作画神器。

3 月 30 日,据外媒报道,图像生成器 Midjourney 已叫停免费试用。公司创始人 &CEO David Holz 在采访中表示,此举的主要原因是新用户的大量涌入。

David Holz 在本周二公布了这项决定,他在社交软件 Discord 上发布消息时,提到了存在“怪异需求和试用滥用”。但在采访邮件中,Holz 则表示叫停免费服务“是因为很多人为了回避付费而注册一次性账户”。

“我们认为这波疯狂的用量潮可能来自中国的一段操作教学视频,再加上 GPU 临时性短缺,导致付费用户的服务陷入了瘫痪。”

但 Holz 之前曾经提到“滥用”,这让人们不禁怀疑此次叫停也许跟 Midjourney 最近生成的一系列病毒式传播图像有关。包括 Trump 被捕和教皇身着时尚夹克的伪造图像,都被部分网民误认为真实存在。

不过 Holz 自己将早期报道称为“误读”,并强调 Midjourney 的免费试用服务从未开放过最新版本的 Midjourney 5,而这些病毒图片中的逼真图像似乎是出自这个最新版本之手。

Midjourney 5 显著提高 了人物图像的描绘质量。例如,以往 AI 生成图像总是处理不好手部形态,这在新版本中已不再是问题。光照和面料质感更加真实,新系统还能生成无数名人和公众人物的形象。

技术层面的改进,也让 Midjourney 的新作在最近几周迅速蹿红。其中不仅包括 Trump 被捕和教皇身着时髦服装等噱头满满的照片,还有法国总统马克龙走过巴黎抗议队伍、马斯克与美国政界“最美女议员” 亚历山德里娅·奥卡西奥 - 科尔特斯牵手等真假难辨的场景。

到目前为止,Midjourney 通过伪造图像引发政治威胁的反应还比较零散,也没有激起该公司对管控政策的重大调整。

Midjourney 的内容限制确实比其他竞争对手(例如 OpenAI 的 DALL-E)更宽松,但目前的管控宽松之王仍然是 Stable Diffusion。

Holz 提到,“把握合理的尺度非常困难,我们很快就会推出改进系统。我们正在听取专家和社区的反馈和建议,希望努力做到审慎适度。”

Holz 去年 10 月曾经提到,Midjourney 保留了一份禁用词清单。“根据各国家 / 地区用户的投诉,这些禁用词与不同国家 / 地区的习俗相关。”但 Midjourney 并没有公开完整的禁用词清单,免得引起“麻烦”。Holz 强调,“除非是要专门跟我们的‘服务条款’对着干,否则几乎没人会注意到‘禁用词清单’。别用我们的工具来找麻烦。”

但随着伪造图片铺天盖地涌出,Midjourney 公司开始扩大这份清单。例如最近他们已经开始禁用“逮捕”一词,这似乎是在回应调查记者 Eliot Higgins 在热门推文中公布的“Trump 被捕瞬间”。Higgins 随后表示,他的 Midjourney 账户已经被封禁。

但这类限制并不难绕过。根据实际测试,虽然无法直接生成“Trump 被捕”的图像,但使用“Trump 戴着手铐,身边围着多名警察”的提示词也能得到相同的输出。

目前,Midjourney 仍未恢复免费试用服务,但后续可能有所松动。Holz 表示,“我们仍在想办法更好地开放免费试用。之前我们要求提供真实有效的邮件地址,但这显然不够,所以现在还要认真规划一番。”

Midjourney v5 
逼真程度惊艳众人

3 月 17 日,Midjourney 发布了其商用 AI 图像合成服务的第 5 版。该服务可以生成非常逼真的图像,其质量水平极高,一些 AI 艺术爱好者认为这些输出令人毛骨悚然且“过于完美”。Midjourney v5 现在处于 alpha 测试阶段,提供给订阅 Midjourney 服务的客户,该服务可通过 Discord 获取。

“MJ v5 给我的感觉就像是在长期视力不佳,自己都习惯了以后终于戴上了眼镜,”经常在 Twitter 上分享她用 Midjourney 创作的平面设计师 Julie Wieland 这样评价。“突然间你看什么都是 4k 效果,感觉不可思议但又令人惊叹。”

Wieland 与 ArsTechnica 分享了她用 Midjourney v5 创作的一些作品。Midjourney 初版于 2022 年 3 月首次发布,而最新的这些作品确实能看出图像细节的明显进步。该服务第 3 版于 8 月推出,第 4 版于 11 月首次亮相。

正如实验所示,每次迭代都会为生成的结果添加更多细节:

Image

Midjourney v3(左)、v4(中)和 v5(右)的输出对比,这里使用的提示是:“一个肌肉发达的野蛮人在 CRT 电视机旁手持武器、电影、8K、工作室照明”。

Midjourney 的工作机制与 Stable Diffusion 和 DALL-E 等图像合成器相近,它使用了经过数百万人造艺术作品训练的 AI 模型,根据称为“提示”的文本描述生成图像。

最近,Midjourney 陷入了版权争议的风暴,一本使用该服务早期版本的漫画书引发了版权质疑。

在对 v5 做了一天的试验后,Wieland 注意到新版改进之处包括“极其逼真的”皮肤纹理和面部特征;更逼真的或电影照明;更好的反射、眩光和阴影;更具表现力的角度或场景概览,以及“近乎完美且不再摇摇晃晃的眼睛”。

当然,还有手。

Image

在过去的一年里,人工智能艺术作品生成器无法正确渲染手这一情况甚至成了网上流行的梗。但值得注意的是,Midjourney v5 可以很好地生成逼真的人手。“大多数时候,它画出来的手是正确的,一只手有 5 个手指,而不是 7-10 个,”Wieland 说。

在新版服务的 Discord 发行说明中 Midjourney 还指出,v5 现在的输出比 v4 具有“更广泛的风格范围”,同时对提示更加敏感,生成的无意义文本更少,图像分辨率也翻倍了。

对 AI 艺术爱好者来说,如果要谈一谈 Midjourney 新版输出看起来有什么缺点,可能就是生成的图像如此逼真和“完美”,以至于模型的高精度带走了“一些重复生成 AI 图像以找到合适结果”的快感——人们可能把这种现象为“老虎机效应”。

尽管一位名叫 PhilippLenssen 的 Twitter 用户指出,“如果你想出了一个图像主题想用它实现,选图的过程还是有点像摸彩,但中奖机会比 v4 更高。”

参考链接:

https://arstechnica.com/information-technology/2023/03/ai-imager-midjourney-v5-stuns-with-photorealistic-images-and-5-fingered-hands/

https://www.theverge.com/2023/3/30/23662940/deepfake-viral-ai-misinformation-midjourney-stops-free-trials