最近中国围棋王者柯洁,在某站的动态问了一个灵魂问题:美术生或相关从业人员如何看待AI绘画。评论区有人第一时间就反问柯洁:你对AI围棋怎么看。这下双方都沉默了。阿尔法狗凭借强硬的实力席卷围棋界,现在许多职业棋手都不彼此约棋了,而是找AI训练,甚至有的去背AI的棋谱。围棋AI和绘画AI把他们本行业最顶尖的专业人士按在地上摩擦,一个学画画的艺术生,如果要纠正作画的失误,需学习需临摹数十幅作品,懒一点的艺术生得花费一个星期乃至一个月的时间。而AI短时间内就能临摹上万幅作品,人类在睡觉吃饭的时候AI都在学习,可以说世界上没有一个人能够卷的过AI绘画。历史一次次的被证明,这就是科技的力量,它迅速地改变世界以往的生活方式。
所以近段时间来,你可能在不少地方都看到了非常多这样的好看的画。
赛博朋克风
油画风格
动漫人物风格
风景图
这些都是AI画出来的,要充分了解AI绘画,先让我们来看看AI绘画比较重要的几个软件:
1:Disco Diffusion
Disco Diffusion 是发布于Google Colab 平台的一款利用人工智能深度学习进行数字艺术创作的工具,它是基于MIT 许可协议的开源工具,可以在Google Drive 直接运行,也可以部署到本地运行。
Disco Diffusion 有一个弊端,就是速度非常慢,动辄 半个小时起步。
2:Midjourney
Midjourney是Disco Diffusion的原作者Somnai所加入的AI艺术项目实验室。
Midjourney 对 Disco Diffusion 进行了改进,平均1分钟能出图。
3:DALL-E 2
OpenAI推出 DALL·E 2, DALL-E 2实现了更高分辨率和更低延迟,而且还包括了新的功能,如编辑现有图像。
目前还没有按到 DALL·E 2 的体验资格。
4:Stable Diffusion
今天给大家重点介绍的是AI绘画中性能强劲的Stable Diffusion,stability.ai 推出 Stable-Diffusion并且开源了,一经推出就受到广大网友的喜爱,操作简单,出图快,平均10-20秒。
输入一句话就能生成图像的 Stable Diffusion 已经火爆数月。它是一个开源模型,而且在消费级 GPU 上就能运行,是一项普通人就能接触到的「黑科技」。废话不多说,现在就带着大家开始上手体验了。
一,官网注册账号
打开
https://beta.dreamstudio.ai/ 选择一种注册方式,我这里使用了 Google 账号登录
这个在官网体验的就不多讲了,可以网上查一下,有很多介绍的文章,默认你注册账号会有200点点数,每次生成一张默认设置的图片就会消耗一个点数,如果你要生成更多的方式就需要付费了, 10 英镑 1000 点数。
二,本机程序的方式
我给大家集成好了一个Stable Diffusion的本机程序包,这个价值1000元的集成工具包,现在免费送给大家,感兴趣的朋友可以在本文下方留言。
1:下载本工具包后,有以上三个文件夹。
2:复制‘sd-webui启动器\webui启动器\’文件夹下面这两个文件到‘数据整合包’下面。
3:复制‘模型’下面的两个文件到‘数据整合包\models\Stable-diffusion’下面。
4:进入数据整合包,双击A点我生成你的启动脚本.bat,等待它自动完成。
5:双击A启动器.exe,进入界面。
直接启动,启动要几分钟时间
看到如上图的界面就启动成功了,请打开图中显示的地址http://127.0.0.1:7860
看到如上图的界面就可以正常使用了,下面是各要素的介绍:
模型:这个是决定能生成的图片的风格,目前里面只有两个,可以在https://civitai.com/下载,下载之后复制到‘数据整合包\models\Stable-diffusion’下面。
文生图:就是文字生成图片。
提示词:文本框中输入想生成图片的相关英文单词或者句子,比如
up close portrait of a beautiful girl spirit, fantasy, intricate, elegant,highly detailed ,digital painting,artstation ,concept art, smooth, sharp focus,illustration。
反向提示词:意思是不要的词,比如你不想要太萝莉的,就写lolita。
采样方法(Sampler) :是生成图片的采样方法,其实在同一个模型下,变化不大。
采样迭代步数(Steps) :采用方法是分步渲染。分步渲染是使用webui独有的语法在同一个绘图中分别绘制不同的prompt,分步渲染,在图像整体成型后再进行绘制,分步渲染需要照明和舞台场景方面的技能和专业知识来捕捉最逼真图像。我一般用40-80。
图生图:顾名思义就是图片生成图片,可以拖一张图片进来,按照想要的样子填入关键词语来生成。如图这个局部手绘比较重要,用这个小黑点画图中的区域,重绘蒙版内容就是重画黑色区域,重绘非蒙版内容就是不重画黑色区域,只画其它区域。
其它很多项目都是字面意思,很好懂,就不一一解释了。
以下是我生成的效果图,感兴趣的朋友可以在本文下方留言,本开源工具包免费送。
本文欢迎转发,转发时请注明本作者和出处。