由AI绘制的逼真照片
新版本介绍
AI 图像生成平台 Midjourney 于 3 月 15 日发布新版本 V5 的测试版,提供更完善的风格与细节演算、解析度也提高一倍,生成图片时所需要的提示词(prompt,又被称作「咏唱咒」)也更灵活,生成出更加逼真与精确的图像。Midjourney 创办人大卫.霍尔兹(David Holz)表示,他们将 Midjourney V5 视为「专业模式」,因为与前几代相比,新的演算法限制更少,提供了更多样的效果。不过 Midjourney V5 也比 V3 和 V4 演算法更「没有主见」,若输入字词太短,输出效果可能不会那麽好,会需要用户提供更精确的要求提示。
穿着湖人球衣的库里
使用方法
至于 Midjourney 要怎麽用呢?首先需要注册 Discord 社群的帐号,并且加入 Midjourney 官方伺服器。加入以后在左侧列表中点选「#newbies-」开头为名的频道,接着在聊天栏输入 /imagine ,就可以把想要生成的图片的提示词输入了。
想象一下一个女孩飞在云朵之中是怎样的场景?AI会给你答案
V5版本优势
Midjourney 新的 V5 演算法是 Midjourney 耗时 5 个月、在 Google Cloud 的超级丛集(AI supercluster)上训练的第二个模型,也使用了不同的神经网路架构和美学技术。 Midjourney V5版本生成图像的画质也提高了两倍,达到 1024 × 1024(原先 V4 的画质是 512 × 512),只是生成的时间和耗用的 GPU 时间也会增加 1 倍。而且不同于旧版本,Midjourney V5 现在也可以使用「自然语言」当提示了;原先「咏唱咒」的格式通常会需要以逗号分开不同的词组,现在已经可以用一句话来当作提示。不过,Midjourney 目前还只支持英文。 Midjourney 还有一个不同以往的新参数:权衡图片提示与文字提示的比重;在提示句末加入参数--iw,就可以让生成的图像更偏向图片提示或是文字提示。 Midjourney 另外还有两个目前还在公开测试当中的参数:拼砖,以及更自由的宽高比。拼砖需在提示句末加入参数--tile,就会生成像墙纸或是地砖一样的无缝重复花纹图案;宽高比则已经不再限于 1:2 到 2:1 的大小,只要--ar后面加上任何的整数比例,就可以生成想要的宽高比例。
包含山川湖泊的剪纸风格绘画设计
根据 Twitter 上的 AI 资深用户 Nick St. Pierre 的分享,新版本 Midjourney 生成的人物图像,风格已经不同以往(如旧版本背景褪色、对比度过于鲜明等),而更像真实世界的照片。 新版本 Midjourney 也终于会画正确数量和形状的手指,也算是一大突破。虽然有时候还是可能生成解剖学上不合理的四肢构造,但作为 AI 生成图像最明显的线索已经大幅减少,让愈来愈多人无法判断图片的真假。 不过 Twitter 上也有评论者指出,在人体一些令人不安的特徵,让这些图片仍「处于恐怖谷」,例如橡胶状皮肤的外观、不合理的纹路。
由AI绘制的汉服女孩
但总体而言,这些结果还是看起来比第 4 版 Midjourney 更真实。 目前只有 Midjourney 付费用户可以试用 V5 演算法,且新版本仍然在不断更新当中,官方表示希望接下来能陆续提供更「亲民」和更真实的视觉风格。