随着人工智能技术的快速发展,AI绘画也逐渐成为了绘画领域的新宠。目前市面上有很多AI绘画软件,其中国外的Midjourney和国内百度文心一格是比较热门的两款。本文将对比这两款软件的绘画命令和案例,探讨它们的区别。

Midjourney和百度文心一格都是基于AI技术的绘画软件,它们都拥有强大的图像处理和分析能力,可以快速生成逼真的图像。但它们的绘画命令和使用方式却有很大的不同。


两个平台的不同

  • Midjourney主要是一款在线艺术创作平台,旨在通过AI技术帮助用户快速生成艺术作品。它的命令较为简单,主要包括“开始创作”、“上传图片”、“选择风格”、“调整参数”、“生成作品”等。Midjourney的绘画风格多样,包括油画、印象派、水彩画等多种艺术风格,用户可以根据自己的需求进行选择。
  • 百度文心一格的绘画命令与其他AI绘画软件相似,但它的优势在于能够生成具有文学特色的绘画作品。百度文心一格的AI技术是基于自然语言处理算法,可以将用户输入的关键词和主题转化为具体的绘画风格和图像元素。用户只需要输入自己的创作需求,百度文心一格就可以自动完成图像的生成和处理。

简单地说,两者最大的不同就是百度可以直接用中文来输入命令,可以很好的识别。而国外的AI绘画平台,虽然也可以识别中文,但是却并不能很好的执行。


国内外AI绘画的平台其实有很多,比如Midjourney、Dall-E等,国内平台基本都是基于Stable Diffusion,本文也通过试验猜测百度的文心一格同样基于Stable Diffusion。


我们通过画两组同样的主题来比较一下两者的区别

第一组我在两个平台画一个孙悟空、绿巨人和葫芦娃一起打扑克、抽雪茄

孙悟空,绿巨人,和葫芦娃一起玩扑克和抽雪茄,超现实主义,照片,高度进化的空间,电影照明,虚幻引擎5,电影的,颜色分级,编辑摄影,电影的

Midjjourney生成的图

孙悟空这个角色国外平台是识别不了的,如果要识别就会识别成日本漫画《七龙珠》里的悟空,所以英文命令里我是用“Monkey king(猴王)”来代替,但是绿巨人(Hulk)是可以被识别的。所以这张图你可以看到绿巨人和猴子的特征、打扑克和抽雪茄都被很好的识别并画出来了,但是毫无疑问“葫芦娃”这个角色直接被忽视,“孙悟空”的特征也并没有表现出来。

没办法,AI训练模型的时候确实理解不了中国文化,中国的神话传说和经典的动画形象基本也没有被囊括在内,那么如果百度宣称有“本地化”优势,会画得更好吗?

百度文心一格画的图

很遗憾,“本地化”的百度文心一格画出来的图,依然是只能识别“猴子”和“绿巨人”两个关键词,壮硕的肌肉线条和绿色的猴子画得倒是不错,只可惜跟“孙悟空”“葫芦娃”没有半点关系。

中国插画家画的孙悟空

从文心一格生成的图片特征来说,很显然,百度并没有针对中国文化进行特别的训练,极有可能直接用的就是Stable Diffusion的模型,所以导致对传统文化背景的角色根本不能识别,更不用说画出来了。


第二组我在两个平台画一个在外星球上的两个透明显示器

两个矩形透明材质屏幕立在星球上,科技感,荒凉,超现实,超写实,高清

百度文心一格的AI绘画

Midjourney生成的画作

如果是不涉及中国传统特色的通用参数,可以看到两者生成的几乎没有区别,第一张图是百度文心一格生成的,第二张图是Midjourney生成的,都包含了该有的外星球、玻璃屏幕等元素,充满了科技感。

综合几个试验,可以看到由于都是基于人工智能技术的图像合成平台,都采用了类似的生成对抗网络(GAN)模型,两者都是可以生成不错的图像的。区别在于MidJourney善于适应实际的艺术风格,创造出用户想要的任何效果组合的图像。它擅长环境效果,特别是幻想和科幻场景,看起来就像游戏的艺术效果。而百度的文心一格的长处在于对中文利用了自然语言处理技术,通过分析文本内容和语义,将文字转换为图像或视频,实现了对中文文字创作的支持。

两者都不免费

Midjourney会给用户提供25 Minutes也就是接近于25张图片的免费额度。免费额度用完了就要采取包月或包年的订阅,价格不菲。

百度文心一格会给用户50个电量,基本上也是25张图片的免费额度,每天通过完成任务还可以增加9张免费额度,超过就要付费。大约10块钱50张。

百度100个电量可以画50张

百度并没有说明是否使用的是Stable Diffusion的技术和模型,但是收费倒是学的有模有样,要知道Stable Diffusion可是已经开源了,任何人都可以在自己电脑上安装,免费不限量。

你觉得是外国AI画的好呢,还是百度文心一格画的好?你会支持哪一家?