上一篇我们说了如何注册和订阅,今天我们来讲一讲相关的细节,首先我们来一个概览图,先有个大致的印象。
概览图
- 生成的四张图片,类似于Demo,从左至右,从上至下,1,2,3,4
- 放大按钮U1,U2,U3,U4:用于放大图像,并添加更多细节,
- 变体按钮V1,V2,V3,V4:用于对所选图像进行进一步变化,风格和构图会与所选图像相似,
- 重做按钮
以上图片,我喜欢3,我就点击U3按钮:
我想让它帮我生成我喜欢图片更多的demo,可以在demo中,点击V3
至此我们就算是基本入门了,可以愉快的玩耍了,接下来我们来详细说一下参数,跟数学公式类似,记住相关的公式,我们也可以是高手。
关键词文本
这个工具的存在,很方便的让我们这些没有艺术细菌的小伙伴,也可以画出经验的作品出来,省去了学习和基础设施的成本,我们只需要提供我们所想要的需求即可,接下来我们看看如何创建出自己想要的图片。
Prompt的结构是什么?
基本Prompt
一个基本的结构长这样,就是一段简短文字描述,非常容易理解,类似于我们demo样图里面的cute,rabbit,这就是一段非常精简的描述,接下来让攻击给我们惊喜。但是好的prompt又很重要,跟你的图片质量息息相关。
Prompt的长度
- 不是说prompt越长越好,要越精确越好,可以是个单词,也可以是个表情。但是太短的描述,又不能很精确的出想要的图片,有各种各样的意外出现,会主要依赖于Midjouney默认的风格,如果描述词太长,但都是一些介词,毫无意义的关键次,你有可能把它带偏,出来的质量就很差,所以尽量控制这个长度,尽可能准确描述,只需要记住“言简意赅”即可。
语法
- 首先必须要知道的,Midjourney Bot无法像人那样理解语法的,因为它底层也是算法,根据你的描述词来匹配相关的短语,你就可以理解为概率问题,推算出一个概率更高的词语,形成短语描述,还有一个简单的办法,那就是ChatGPT,我们只需要提供问题,它来生成相关的创意和短语,所以写prompt的时候写得单词关键词就尤其的关键,如果没有ChatGPT,没关系,博主免费提供,不登录、不注册、不搜集信息 ChatGPT传送门
- 官方给的提示是越具体的同义词效果越好,而且要尽可能删除单词,更少的词意味着每个词的影响力更大。单词间通过逗号、括号或者连字符来组织想法。
- 不用考虑大写英文单词
专注于想要的,而不是不想要的
- 描述时不要多一个反逻辑,就正向思维说你想要XX呈现在图片中,但是算法有一些意外情况出现,出现了不想要的东西,那么我们可以使用 --no参数去掉不要的东西。
关于量化词
如果要控制图片中某个物体的数量,尽量具体化。比如说”two cats“。
好了,有了以上的概念是不是跃跃欲试了,我们来简单的使用一下之前的关键词,如果还是写不出来,没关系,用刚才的ChatGPT我们来试试,打开网站之后,我们直接输入问题即可,不需要登录和注册,我们来看一下相关的文案 ChatGPT传送门
我们选择其中一个我们来看一下效果
当然了如果感觉不合适,我们可以继续添加关键词,比如猫咪必须要是布偶猫,我们直接在对话框输入关键词即可,如下图:
直接把关键词加入刚才的描述语句中,我们来看一下效果。
如果不想要其中的某些东西,去掉关键词或者使用 --no xxx 来去掉生成图片中的不确定因素。凡事皆可调,现在是不是又一些感觉了呢。接下来我们来看一看相关的参数配置。
Midjourney Prompt 常用参数
简单说来,你可以将这些参数理解为官方的固定 prompt 模版,而且这个模板包含了一些特殊字符,让模型能百分百保证输出结果的一致性,并且还能提升 prompt 的准确度和输入效率。
如果你有用过 ChatGPT ,应该会遇到过这种场景,用了别人一样的 prompt 模板,但却没法令 ChatGPT 生成相同的内容。
而 Midjourney 因为是图片类目,相对比较垂直,所以他们将很多图片类的通用 prompt 语句做成了模板,比如图片长宽比,有 1:1、2:3、4:7 等等,如果你要用 ChatGPT 的使用习惯,就需要在 prompt 里不断重复 Aspect Ratios 1:1 等,而且每个人的表达 Aspect Ratios 的方式都不一样,模型还要去理解人说的话,比较麻烦。
所以 Midjourney 就设计了一些参数,让你能快速调用,比如 Aspect Ratio 这个,就只需要输入 — ar 1:1 即可。同时因为固定了表达方式,大家要改长宽比,都会用这种方式表达,Midjourney 调整下模型,就能保证输出的图片的一致性了。
因为其稳定且必须,所以我才会先教各位参数。
Version
目前 Midjourney 支持多个版本,最新的版本是 V5 ,跟 ChatGPT 稍微有点不一样,Midjourney 给我的感觉,并不是版本越大,越厉害,而是擅长的东西不太一样。相关区别请查阅 Midjourney 各版本差异。
Version 参数使用方式见下表。你也可以在设置里,调整默认的版本,相关教程请查阅 Midjourney 基础设置。
调用方法 | 使用案例 | 注意事项 |
---|---|---|
在关键词后加空格,然后带上版本参数:
| vibrant california poppies --v 5 | 版本仅支持 1、2、3、4、5。 |
因为可以在 prompt 里直接加版本参数,同时又可以在设置里设置版本,所以你有可能会遇到如下图这样的情况(我想生成版本 1 的图,但设置里设置了 5 怎么办?):
此时模型会按照从左往右的顺序运行这些参数,按照上面的例子,其实生成的图片是 V1 版本,可以跟下面的这个 V5 版本对比下:
Aspect Ratios
第一个参数是图片的长宽比,使用方式如下,及版本差异如下:
调用方法 | 使用案例 | 注意事项 | V5 | V4 | V3 | niji |
---|---|---|---|---|---|---|
在关键词后加空格,然后带上长宽比参数:
| vibrant california poppies --ar 5:4 |
| ✅ 支持任意比例。但2:1以上的宽高比是实验性的,可能会产生不可预测的结果。 | ✅ 1:2 到 2:1 | ✅ 5:2 到 2:5 | ✅ 1:2 到 2:1 |
另外,长宽比在业界也有最佳实践:
- 5:4 多用于传统打印
- 3:2 多用于照片打印
- 7:4 比例接近于 HD TV 的比例,或者是智能手机
No
这个参数的意思是不要什么,如果你不想让 AI 生成的图片里出现树,那就输入 plants 即可:
调用方法 | 使用案例 | 注意事项 | V5 | V4 | V3 | niji |
---|---|---|---|---|---|---|
在关键词后加空格,然后带上你不想 AI 生成的内容:
| —no plants | 无 | ✅ | ✅ | ✅ | ✅ |
Chaos
这个参数跟 ChatGPT 里的 Top P 有点像,主要控制模型的随机性,数字越高,约有可能产生一些意想不到的结果,数字越低一致性会更高。看看官方的例子, prompt 是 watermelon owl hybrid。
这是当 Chaos 为 0 的时候,一致性会比较高,西瓜和猫头鹰的融合的方式,在四次输出里都比较类似,另外在单次输出里,4张图(四宫格)的风格相似度也比较高:
这是 Chaos 为 100 的时候,你会发现多次输出的融合风格都不太一样,且即使是在单次输出里,4 张图的风格区别也比较大。如果你是想让 AI 帮你做一些探索性的事情,我建议初期可以将 Chaos 调高一点,结果会发散一些。
调用方法 | 使用案例 | 注意事项 | V5 | V4 | V3 | niji |
---|---|---|---|---|---|---|
在关键词后加空格,然后带数字:
| —c 10 | 可以输入 0 - 100,默认是 0 | ✅ | ✅ | ✅ | ✅ |
Stylize
这个参数跟 ChatGPT 里的 Temperature 有点像,主要是控制生成图片的风格化程度。简单理解,这个值越低会更符合 prompt 的描述,数值越高艺术性就会越强,但跟 prompt 关联性就会比较弱。
我们一起看下官方的例子,prompt 都是 colorful risograph of a fig。Risograph是一种数字印刷机,它使用模板和专用油墨来制作印刷品。Risograph通常用于制作海报、宣传册等低成本印刷品。这种印刷机可以产生特殊的色彩和纹理效果,头三张图基本上契合 risograph 的风格,但右下角那四张就非常不像了,模型加了很多戏 😂
除了在 prompt 里输入外,你也可以在设置里,调整默认的版本,相关教程请查阅 Midjourney 基础设置。
调用方法 | 使用案例 | 注意事项 | V5 | V4 | V3 | niji |
---|---|---|---|---|---|---|
在关键词后加空格,然后带数字:
| —s 50 | 默认是 100 | ✅ | ✅ | ✅ | ✅ |
Niji
这个其实 Niji 模型,是 Midjourney 跟 Spellbrush 一起开发的。「niji」是日语「にじ」,意思是「彩虹」 或者 「2D」。
它在生成动漫类的图片上,比较在行。举个例子,prompt 是 fancy peacock,左图是 v5 模型,右图是 niji v5模型,右图更偏向于漫画风格:
使用方法跟 Version 比较像,只需要在文字 prompt 最后输入 —niji 即可
调用方法 | 使用案例 | 注意事项 |
---|---|---|
在关键词后加空格,然后带上版本参数:
| vibrant california poppies --niji | 部分参数对 Niji 无效。大家可以在完整列表里查看哪些参数对 Niji 无效。 |
Midjourney 基础设置
打开设置
你可以在 Midjourney 的服务器,或者 Midjourney Bot 聊天窗口,输入 /setting,然后按下回车:
接着你就能看到这样的 Bot 消息:
版本设置
第一二行是版本切换,你可以根据自己的需要切换不同的版本,MJ Version 1-5 分别表示 Midjourney 的不同版本,切换后,输出的所有图,默认都会用该版本生成,各个版本区别请查阅 Midjourney 各版本差异。 2023 年 4 月 5 日,Midjourney 上线了其 Niji 5,所以版本设置截图里会有 Niji 4 和 Niji 5 Mode 按钮,请知悉:
图像质量设置
第三行是图像质量设置。注意这个参数并不影响分辨率。它改变的更多的是图片的细节,详细的介绍可以查阅 Midjourney Prompt 高级参数 这一章。
基本上保持默认的就可以了,即图中的 Base quality:
风格设置
第四行风格设置,风格设置简单理解,这个值越低会更符合 prompt 的描述,数值越高艺术性就会越强,但跟 prompt 关联性就会比较弱。详细的介绍可以查阅 Midjourney Prompt 常用参数 这一章。
隐私设置
这个设置默认是 Public(公开),只有付费的 Pro 用户可以将其设置为 Stealth Mode(隐私),Basic 和 Standard 都没法设置为 Stealth,对 Midjourney 付费感兴趣的可以看看 订阅 Midjourney 会员 这一章。
Remix 设置
Remix Mode 目前是一个实验功能,可能会随时更改或删除。
我自己使用下来,有点像 blend(混合)图片模式,使用方法是这样的。首先在 Remix 模式下,点击 Variation 按钮,会弹出一个 Prompt 输入框,输入完后,模型会在不改变第一张图的结构的情况下,增加 Prompt 里提到的内容,比如下面这个例子,第一张图原来是一堆南瓜,点击 Variation 按钮输入 pile of cartoon owls ,就会生成了一张保留原来南瓜图构图,但主体换成了卡通猫头鹰的图。
生成速度设置
这个默认是 Fast Mode,这个只有付费的 Standard 和 Pro 用户可以设置,其余用户都是 Fast Mode。Standard 和 Pro 用户可以在 Relax Mode 模式下,生成无限图片。对 Midjourney 付费感兴趣的可以看看 订阅 Midjourney 会员 这一章。
看到这里,我知道你是真想想学习的伙伴,网上一堆的付费教程和软件,质量参差不齐的,我也不敢说我提供的就是好的,但这些东西都是经过博主验证的,具体可以参考本篇文章哈,我也是借鉴的,因为有轮子了我为什么要造呢,我分享出去,给更多的人使用,岂不是更美,想了解更深,更系统的,可以参考 基础ChatGPT+Midjourney指南传送门
欢迎来撩咯
我可以提供:
1. 注意🚨!本平台不允许存在任何敏感词,请勿使用任何带有敏感词汇的言论,否则将会受到平台的严厉处理🛡️。
2. 非常重要❗️!只可以分享ChatGPT前沿的东西或者使用ChatGPT的成果展示,不可发布其他无关信息💪,否则将送飞机票🔴。
3. 着重强调🔍!我只解决以下问题
-提供搭建个人版ChatGPT整体教程和解惑
-提供常见ChatGPT的玩法和指令
-常见案例分享,例如小红书文案设计
-科学上网自搭建,不保证可以上官方WEB端,跟你个人节点相关,但是可以保证上外网
-new bing上网跳转不过去,即使跳过去,也打不开聊天,教程分享,因为问题很多也很杂,不一定是我所遇到过的,不过我一定解决能上为止(付费)
-ChatGPT不是联网的,怎么才能用到最新的资讯,建议使用new Bing 和 谷歌插件 ,可提供相关教程(免费)
🚨🚨🚨重点:
- 不提供ChatGPT账号,可以提供同等效力的账号,核心基于ChatGPT3.5的账号,可详细咨询(付费)。
-不提供代充和Plus相关的服务,可以提供相关的路径,不求最低,只能说靠谱(免费)。
-不提供midjourney(绘画工具)相关账号,可以提供相关的路径,不求最低,只能说靠谱(免费)。
-不提供其他三方科学上网介绍,可以提供我自搭建账号,免去查找和是否稳定的麻烦
以上内容,均真实有效,请遵守相关约定,不做非法非国家允许的事情,谢谢您的配合。