Midjourney Prompt 有人称之为“关键词”,其实我觉得翻译为“提示词”更确切。
了解文本内容,我们一起深度理解提示词,掌握一个真正的万能结构,从此构建属于你的“咒语”!
提示结构
首先了解下,/imagine命令的提示结构
- Image Prompts :即“喂图”,可以将图像URL添加到提示中以影响最终结果。图片URL始终位于提示的前面。
- Text Prompt : 文字提示词。要生成的图像的文本描述。
- Parameters:参数。更改宽高比、模型等。参数位于提示的末尾。
文字提示词
精心编写的文字提示词,对获得我们理想图像至关重要。
Midjourney Bot 还没觉醒到,能够读取我们脑海中的意识,因此,我们需要付出足够的耐心!
完整具体
提示词不够完整具体,那么Midjourney Bot将依赖默认式样生成,可能出现我们不需要的惊喜!
假设我们只是简单提示“猫”,那么Midjourney可能给的任何猫。而我们若有需求,可以这样提示说:“两只大猫和一只小猫。”
简洁明晰
Midjourney Bot 不像人类那样理解语法、句子结构和单词。
因此,提示选择什么样的词很重要。应在简洁前提下,清晰做出描述。并且只描述我们想要什么,而不是不想要什么。
如果不想出现什么,请尝试使用--no参数。
一些例子
提示词是“三只猫(其中一只大猫和两只小猫)”,这样很容易让 Midjourney Bot 误解。
而写成:“一只大猫和两只小猫”,这样 Midjourney Bot 的理解会更准确一些。
另外,因为 Midjourney 仅支持英文的关系,小猫写成Kitten更确切,small cat 也会让 Midjourney Bot 误解。
一些要点
- 可以使用逗号、括号和连字符来帮助我们组织想法,但 Midjourney Bot 并不会可靠的解释它们。
- 不区分大小写,可以使用逗号、括号和连字符,但不要是{},Midjourney对{}另有含义。
知识点
所有提示,最终都会被Bot拆分成tag去理解,对符号的解释并不可靠,我们应尽量避免多义的可能,才能获得更准确的结果。
提示词万能结构
提示词万能结构:内容 + 构成 + 风格
我将此称为“CCS结构”,即内容(Content)、构成(Composition)和风格(Style)
内容、构成和风格是艺术领域创作不可缺少的三个关键要素。内容指的是艺术的主题内容,构成是元素的排列和组织方式,风格则是艺术执行的独特方式,包括技术、手法、材料、载体等。
三部分的提示词都尽量具体化提示,可以减少Bot自由发挥的空间,能更接近预期效果。
CSS结构也有助于我们整理思路,更有条理的组织,及部分提示词形成模板在利用。如保证风格和构成不变,只修改内容部分,更容易得到看似同系列的作品。
这里有一段传统艺术领域对三个要素的理解,可以给我们一些启发:
“在许多方面,内容、构成和风格是艺术的相互关联的方面。内容可以启发构成,而构成可以影响风格。同样,风格通常可以用来增强或强化艺术的内容和构成。为了创造成功的艺术作品,艺术家必须仔细考虑所有三个要素以及它们彼此之间的相互作用。如此,我们可以创造出既视觉上令人惊叹又心智上引人入胜的作品,能够预期的向观众传达复杂的思想和情感。
内容提示词的范例
主体:
A pretty young woman in a white dress 一个穿着白色裙子的漂亮年轻女人
A castle made out offlower 一座被鲜花包裹的城堡
Blacklight building 黑光效果的大楼(将颜色直接给主体定义也可以)
mascot for milk brand 乳制品的吉祥物
Tshirt vector Pikachu T恤衫矢量风格的圣斗士
环境:
indoors(室内), outdoors(户外), on the moon(月球上), in Narnia(在纳尼亚), underwater(水下), the Emerald City(翡翠城),tundra(苔原),salt flat(盐沼),jungle(丛林),desert(沙漠),mountain(山),cloud forest(云雾森林),savannah(热带草原),wetland(湿地),estuary(河口),fjord(峡湾),steppe(草原),dune(沙丘),oasis(绿洲),bay(海湾),hill(山丘),delta(三角洲),cave(洞穴),volcano(火山),waterfall(瀑布),beach(海滩),cliff(悬崖)等等,具体如on the beach at sunset(在夕阳下的海滩)这样更佳。
情绪:determined(坚定的), happy(欢乐的),sleepy(昏昏欲睡的), angry(愤怒的), shy(害羞的), embarassed(尴尬的),Sedate(稳重), calm(平静), raucous(喧闹), energetic(精力充沛)等等……
构成提示词的范例
构图:Portrait(肖像画)、headshot(头像)、half-body portrait(半身像)、closeup(特写)、Full body shot(全身照)、Three-quarter shot(三分之二侧身照)、Profile shot(侧面照)、Action shot(动作照)、Landscape shot(风景照)、Still life shot(静物照)等。
视角:Top View(俯视图)、 birds-eye view(鸟瞰图)、Horizontal angel(水平角度)、Lookup(仰视)、font view、side view(侧视图)、back view(背视图)、Perspective(透视图)、POV(摄影机视角)等。
照明:soft(柔和的), ambient(环境光), overcast(阴天的), neon(霓虹灯), studio lights(工作室灯)、in the style of soft(柔和的风格)等。
色调:vibrant(鲜艳的), muted(静柔暗淡的), bright(明亮的), monochromatic(单色的), colorful(多彩的), black and white(黑白的), pastel(淡彩的)等。
色彩:Millennial Pink(千禧粉) Acid Green(酸性绿) Desaturated(去饱和度的) Canary Yellow(淡黄色) Peach(桃红色) Two Toned(双色调) Pastel(粉彩) Mauve(淡紫色) Ebony(乌木色) Neutral(中性色) Day Glo (日格洛) Green Tinted(绿调染色),light bronze and amber(浅青铜和琥珀色)
风格提示词的范例
艺术形式(Medium):photo(照片), painting(绘画), illustration(插图), sculpture(雕塑), doodle(涂鸦), tapestry(挂毯),Block Print(版画), Folk Art(民间艺术), Cyanotype(蓝版), Graffiti(涂鸦), Paint-by-Numbers(数字画), Risograph(曲线图), Ukiyo-e(浮世绘), Pencil Sketch(铅笔素描), Watercolor(水彩画), Pixel Art(像素画), Blacklight Painting(黑光绘图), Cross Stitch(十字绣)等等。
注:艺术形式是定义风格的最佳方法之一。
技巧手法:Life Drawing(写生), Continuous Line(连续线条画), Loose Gestural(速写), Blind Contour(盲画), Value Study(明暗画法), Charcoal Sketch(炭笔素描)等等,可以对艺术形式作为补充,也可以单独使用。
年代(Decade):1700s、1700s、1800s、1900s、1910s、1920s、1930s、1940s、1950s、1960s、1970s、1980s、1990s等等,可以强化画风。
当然,风格提示词有很多,完全不局限于上述这些单词及表述形式,稍后在其他篇章,我们将继续深入用实例分析。
简单的示范
提示词如下:
A pretty young woman in a white dress,on the beach at sunset,shy, --v 5.1
一个穿白色裙子的漂亮年轻女人,在夕阳下的海滩,害羞的。
我们只提示了“内容”,没有“构成”和“风格”,所以构图、视角、照明、色彩、颜色这些都是随机的,只不过是介于我们提示了“夕阳下的海滩”,因此效果相对接近预期,色调、颜色不会偏差太大。但构图、视角这些很随机,而且有三张图是CG风格,只有图3是照片风格。必要的没有提示,Bot就自由发挥。
我们调整下提示词:
A pretty young woman in a white dress,on the beach at sunset,shy,Three-quarter shot,Lookup,soft,bright,light bronze and amber --v5.1
一个穿白色裙子的漂亮年轻女人,在夕阳下的海滩,害羞的,三分之二侧身照,仰视,柔和的,光亮的,浅青铜和琥珀色。
三分之二侧身照与仰视效果已表现。光线更柔和(与之前对比明显)。夕阳更光亮。浅青铜和琥珀色也有明显表现。而 Midjourney Bot 的智能补充结果也很棒:因为三分之二侧身照属人像,因此默认半身像,且背景虚化(人像摄影常用的大光圈景深),仰视角度配合侧身照也刚好。
我们改一个视角看看:
A pretty young woman in a white dress,on the beach at sunset,shy,Three-quarter shot,Top View,soft,bright,light bronze and amber --v 5.1
一个穿白色裙子的漂亮年轻女人,在夕阳下的海滩,害羞的,三分之二侧身照,俯视,柔和的,光亮的,浅青铜和琥珀色。
我们只调整了一个提示词,将“仰视”改为了“俯视”,对比一下吧,是不是感觉视线高了一些?
我们再尝试调整一些风格提示词:
A pretty young woman in a white dress,on the beach at sunset,shy,photo --v 5.1
一个穿白色裙子的漂亮年轻女人,在夕阳下的海滩,害羞的,照片。
为了更好的展示区别,我们去掉了构成提示部分,保持原来的内容部分,然后增加了风格提示词:照片。
可以看到,构图、角度、色调又开始自由发挥了,但是“照片”提示词已经起作用了,无论是人物、还是大海、沙滩,看不到绘画感了,每一个细节都是照片的感觉。(可以点大图看,请容易分辨,和之前对比)
我们再尝试调整一个风格:
A pretty young woman in a white dress,on the beach at sunset,shy,Ukiyo-e --v 5.1
这次从照片换成了浮世绘风格了。风格部分提示词中,艺术形式(Medium)是最影响画风,也是最方便定义风格的。
一些补充知识
除Portrait(肖像画)、headshot(头像)和closeup(特写)构图外,常用的还有:
Full body shot(全身照):指将整个人物或物体的形象呈现在画面中。
Three-quarter shot(三分之二侧身照):指将人物或物体的形象呈现在画面中,但略微侧身,呈现出画面的动态感。
Profile shot(侧面照):指将人物或物体的侧面形象呈现在画面中。
Action shot(动作照):指捕捉到人物或物体在运动或活动中的形象,以呈现出画面的动态感。
Landscape shot(风景照):指捕捉到自然风景或城市景观的形象,以呈现出画面的广阔感和气氛。
Still life shot(静物照):指呈现出静止的物体或物品的形象,通常用于绘制静物画。
常用的视角有:
Top View(俯视):是一种从正上方的视角观察物体的视图。在绘画软件中,Top View通常用于查看和编辑平面图形和二维图像。
Birds-eye View(鸟瞰):是一种从高处向下的视角观察物体的视图。在绘画软件中,Bird's-eye View通常用于查看和编辑三维场景和模型。
Horizontal Angle(水平角度):是相机或视角与地面平面之间的夹角。在绘画软件中,通过调整水平角度可以改变绘画作品中的景深和透视效果。
Lookup(仰视):是相机或视角相对于地面平面的仰角。在绘画软件中,通过调整抬头角度可以改变绘画作品中的高度感和远近感。
Front View(正视):是一种从正面的视角观察物体的视图。在绘画软件中,Front View通常用于编辑三维模型的前面部分。
Side View(侧视):是一种从侧面的视角观察物体的视图。在绘画软件中,Side View通常用于编辑三维模型的侧面部分。
Back View(背视):是一种从背面的视角观察物体的视图。在绘画软件中,Back View通常用于编辑三维模型的背面部分。
Perspective View(透视图):是一种通过透视效果来呈现物体深度和距离的视图。在绘画软件中,Perspective View通常用于编辑三维场景和模型,以便更好地模拟真实的透视效果。
POV(Point of View 摄影机视角):POV通常是指从一个特定的角度或位置观察物体或场景的视角。在AI绘画软件中,POV通常用于模拟真实世界中的摄影机视角,以便更好地呈现绘画作品。POV视角在绘画软件中非常有用,可以帮助艺术家更好地控制和编辑他们的作品。例如,艺术家可以使用POV视角来模拟不同的光照效果,调整摄影机的位置和角度,以便更好地捕捉画面中的细节和氛围。POV视角还可以用于模拟虚拟现实(VR)场景中的视角,以便更好地呈现虚拟现实体验。
一些艺术形式(Medium)的详解
Life Drawing(写生):指在现实中观察人体或物体的形象,并在纸上进行绘制的技术。Life Drawing通常被认为是绘画技巧的基础,有助于艺术家更好地掌握形态和比例等基本概念。
Continuous Line(连续线条画):指使用一条连续的线条来绘制整个画面的技术。这种技术旨在捕捉物体的形态和轮廓,具有独特的表现力和动态感。
Loose Gestural(速写):指通过快速和松散的线条来表达人物或物体的动态和姿态。这种技术通常用于表现运动、舞蹈和其他动态场景。 这种技巧也通常用于表现感性和情感化的主题,在绘画过程中强调艺术家的技能和风格。
Blind Contour(盲画):指在观察物体时将视线集中在物体上,同时不看画纸,只使用手和笔来绘制物体的轮廓和形态。这种技术旨在培养艺术家的观察能力和手眼协调能力。
Value Study(明暗画法):指通过对画面中不同区域的明暗变化进行分析和处理,以呈现出物体的形态和光影效果。这种技术通常用于绘制现实主义和写实主义作品。
Charcoal Sketch(炭笔素描):指使用炭笔在纸上进行的快速素描。这种技术通常用于表现柔和的灰调和柔和的线条效果,具有独特的表现力和质感。
本篇完。
本教程由 @加文三月 撰写,其中一部分图片和文字来自Midjourney官网资料。
本教程持续更新,请提前关注及收藏!