一、V4和V5图像对比:所有图片建议点击看大图
V4 | V5 |
偏艺术表现,最喜欢那抹光 | 看瓦片,整体更偏写实、立体一些,注意墙面、地面光影投射。 |
色泽更平面一些,偏插画风格。 | 对比度更强烈,光泽更立体,材质的真实感,地面的阴影。 |
眼睫毛像种植的,硬的能扎人。 | 眼睫毛更真实,粗细变化明显,放大感觉一下从毛孔里长出的效果。 |
面部柔化效果强。 | 毛孔细节、仔细对比左图,观察脸上的各处光线投影!衣服锁线。 |
电影海报的感觉 | 电影场景,左上角光线投射的感觉! |
看着很漂亮,但其实玻璃窗上的树影是计算错误的,既不是建筑后面的,也不是反射的内容。 | 透明玻璃正确的展示了建筑后面的树木场景。 |
室内 | 这张亮色调的没有发现明显的优劣 |
从上面的各类图像对比中,我看到的最明显进步不是简单的真实性,而是光线计算的准确性,在所有图像的光线、阴影和投影的处理上,新版都更加准确,令人印象深刻。
二、V5 版有什么新功能?
这部分我挑几句官方公告里的内容解读一下。
1、官方:更广泛的风格化范围和更灵敏的提示
这里指的是风格化参数,可以通过在提示末尾添加 --stylize 参数来调整图像的 Midjourney 样式数值,范围从0-1000,根据测试0 更偏向于艺术化处理,1000 偏向真实化处理。
stylize=0 | |
stylize=100 | |
stylize=500 | |
stylize=1000 |
2、官方:改进的动态范围dynamic range
图像的动态范围是图像中最白值(最亮)和最暗值之间的比率。对于相机,动态范围决定了可以在图像中捕获多少细节。动态范围越高,图像中可以捕捉到的细节就越多,也就是暗处可以看到更多的细节。
这个特性在上面的展示中可以看到,不过公众号估计压缩后丢失的也多。
3、官方:支持无缝平铺的 --tile 参数
这个以前就有,这次有了些改进。
官方:这里的权衡是它可能更难使用,简短的提示可能也不起作用,你应该尝试写更长、更明确的文字来说明你想要什么(例如:“带有戏剧性灯光的电影照片”)。
从实际测试来看,Midjourney V5对自然化的语言理解更好,也就是说你可以用更日常化的语言描述内容,ChatGPT技术也在引导着各类AI努力更像人类一样进行语言的交流,看一下同样的提示语不同时间的表现对比。
在火星上吃鸡腿的熊猫 2022.6.16 | V5 饿不着了 |
V4姿势不错 | V5,背景细节更多,光线更丰富 |
7、官方:现在还没有提供 V5 的放大功能,V5 现在的默认分辨率与 V4 放大后的相同。所以现在你点击放大,它会立即给你一张图片,因为不经过放大过程。
也就是说现在的默认尺寸直接是旧版的2倍!
8、官方:支持 --ar 宽高比大于 2:1
意味着什么,你可以做《地上一百层》的超长插图了,或者清明上河图超宽画幅,公众号里就不方便展示了。
9、画手如何?啥也不说了,看图,数数,六指狂魔偶尔还在。
从实际表现看,如果你的提示语中提到了手,大概率表现会好一些,如果没有提到手,但实际内容出现人手了,还是有很明显的瑕疵,但整体比以往的版本表现要好。感觉这次主要解决的是手的数量问题,手指的长度比例绝大多数都还比较怪异,具体到手的动作表现,更是有很多问题。
(点击看大图,光线都好美),拿笔的姿势好难,类似这种需要手部姿势的,很少有完全对的。感觉手需要解决的变量还是很多:数量-比例-姿势-质感-纹理-左右,都是一个一个需要攻克的难关,好在都看到希望了。今年应该可以解决掉。
10、人像的统一性
看到上面的图片,你有没有注意到这些是同一人物不同角度的展示!细节的相似性相当高,这个功能意味着什么?以往公众号多次探讨过《如何在Midjourney中创建风格一致的角色?》,上面的展示说明Midjourney已经具备了实现人物外观统一性的技术能力,这是以往很多人一直在期盼的功能,目前的实验还很简单,没有详细研究,未来看结合种子数等等是否有更好的呈现方式。
三、One more thing:发布Midjourney月刊
Midjourney官方还发布了一份展示 Midjourney 社区多元化创意的月刊,。
订阅地址:https://mag.midjourney.com/
现在订阅的前10000名可免费获得第一期(使用促销码:subscriber),Issue One 将以先到先得的方式提供,供应有限,每期定价$4。每本杂志都精选了 10,000 张评价最高的图片,以及对 Midjourney 社区成员的采访。
我先定上了,但这是实体书?实体书的话发国际快递?中国分公司发货?
欢迎您的加入!
根据你的喜好,推荐阅读以下AI绘画内容:
欢迎 转发、点赞、关注、打赏