IT之家 5 月 4 日消息,AI 作图工具 Midjourney 近日发布了最新的 5.1 版本,宣称能够为用户带来更高质量、更有个性的 AI 艺术作品。
Midjourney 是一家提供生成式 AI 艺术服务的公司,用户只需在 Discord 上输入一些文字或图片,就可以让 AI 根据自己的喜好和风格创作出独一无二的艺术作品。Midjourney 的引擎经过多次升级,目前已经达到了 5.1 版本,据官方介绍,这一版本的引擎更加“有主见”,能够生成出更接近 4.0 版本的效果,但质量更高。此外,还有一个“原始”模式,供那些不想要太强个性化效果的用户使用。其他方面的改进包括:准确度提高,图像中不想要的边框减少,文字失真情况减少,锐度增强。
为了验证 Midjourney 5.1 的表现,外媒 forbes 用同样的文字提示词在 5.0 和 5.1 版本中分别生成了四张图片,并进行了对比。所有其他设置都保持不变,Midjourney 设置为基础质量和中等风格。IT之家注:在所有下面的图片中,左边四张是 Midjourney 5.0 的结果,右边四张是 5.1 的结果。
第一个提示词是“女人走在鹅卵石街道上,走向日落”:
可以看到,在 Midjourney 5.0 中有一个一直存在的问题,就是过度强烈、不自然的镜头光晕效果,而在 5.1 版本中这个问题得到了解决。日落在 5.1 版本中看起来更自然,天空也更温暖、更有趣。
第二个提示词是“油漆厂爆炸,矢量艺术”:
同样地,5.1 版本的图片比 5.0 版本的更出色,颜色运用得更好,构图也更有动感。
人脸是 Midjourney 的一个强项,下一张图片的提示词是“戴着泳镜的孩子的特写”:
这次可以体现 Midjourney 5.1 版本更有“主见”,5.0 版本中的图片都很普通,就像是用智能手机拍摄的孩子戴着眼镜的快照。而 5.1 版本中右边的图片则有更强的艺术感,就像是由专业摄影师拍摄的。
最后外媒测试了一下 5.1 版本是否真的减少了文字失真的问题,提示词如下:“街角卖报纸的人,1950 年代风格,棕褐色”:
首先,值得注意的是,两个版本都误解了提示词,生成了一个拿着报纸的推销员,而不是一个卖报纸的人,但这可以通过修改提示词来改进。两组图片中背景都有文字,不过两者之间没有太大的区别。从远处看两组图片中的文字都还可以,但是当放大看时,就会发现它们大部分都是无意义的文字。5.1 版本中的图片构图更强,主题占据了更多的画面空间。
最新 Midjourney 5.1 版本目前还在测试中,Midjourney 的用户可以通过在 Discord 上输入 /settings 命令来默认使用 5.1 版本。该公司计划在本周末之前将 Midjourney 5.1 作为默认模式。