1

从三月中旬到现在,我的大脑一直有一种嗡嗡的感觉,就是因为Midjourney V5的出现,尤其是看了N多脑洞大开的作品之后。虽然此前就关注过AIGC的动态,包括MJ玩家的使用分享,但确实没有过现在这种WOW的感觉。

简单试用,还没入门的我只用几句话就能生成震撼的不得了的图片了。

这是我最早出的图,一开始想到的必然是猫,就出一只开车的猫吧,仔细看仪表盘是错误的,但我已经无比惊讶了。

一只开车的猫

当然翻车的事儿也不少,比如我想复刻一个表情包“没时间解释了,快上车!”,如下:

我想复刻的表情包

结果给我出了个“没时间解释了,快停车!”,画面是这样的:

“没时间解释了,快停车!”

画风巨变,直接给我笑翻了,后来我发现Midjourney在自娱自乐方面真是无敌的存在。

后来又试着复刻“民宅失火微笑女孩”的表情包:

我想复刻的表情包

这会还真行,基本成功,虽然有点喜形于色

民宅失火微笑小猫

这张完全不行,就一纵火犯,“来抓我啊!”:

“来抓我啊!”

出了一堆猫,过足了瘾,我看网友出的赛博朋克风格比较多,也想试试,本以为挺困难,没想到几句话搞定。

赛博朋克风格中国女性


赛博朋克风格中国女性

赛博朋克风格人物


赛博朋克风格中国男性


赛博朋克风格中国男性

这张我做了新尝试,写的是施瓦辛格风格的中国男性,不过说实话,我这时候用的是V4版本,感觉中国人的面孔有点不那么阳光,尤其是男性,加了白人演员的名字稍微好了点,但始终缺了点像汤姆汉克斯那种正派的感觉,直到后来用V5这种感觉有了明显改观。

赛博朋克风格中国男性

后来我想到了最喜欢看的一部电影,《罗马假日》,我想如果故事发生在未来,或者赛博时代,画面会是什么样儿?于是就有了这两张“赛博假日”:

赛博假日


赛博假日

2

在这之后,我开始试V5出图了,先出了点未来机械风格,虽然看了很多网友的图,但我还是被不小地震撼了一把,机械部件贴合,光线和反光自然,人物、金属和玻璃的质感真实。


机械风格,V5


机械风格,V5

我估计这类机械、赛博题材应该很多人都会尝试生成,对AI来说可能经验也最丰富。我想尝试点有难度的,忽然想到自己曾做过一个最神奇的贴地飞行的梦,在梦里感觉自己像飞又像跑,贴着地面,在城市大街小巷中疾驰,还能灵活的转弯,甚至一跃而起,飞檐走壁。在经过多次尝试后,我竟然用AI完美还原了这个梦:

贴地飞行的梦境


贴地飞行的梦境


在飞行中可以随时停下来


可以自如转弯


可以悬停


可以一跃而起


甚至可以飞檐走壁

这时候我发现中国人的面孔在V5中改观不少,这一点值得肯定。

然后我又用新版出了几张《赛博假日》。

赛博假日


赛博假日


赛博假日


赛博假日

这一串像电影镜头一样的画面,与其说是赛博时代的故事,我感觉更像现代或近未来,但不论发生在何时何地,给我的震撼都是一样的。

然后我又出了一堆舞枪弄棒的小奶猫儿,就叫《功夫小猫儿》


功夫小猫儿


功夫小猫儿


功夫小猫儿


功夫小猫儿

这张看起来最真实,《毛球大战》:

毛球大战

这张是《猫城记》,一个居民全是猫的小镇:

猫城记

玩到这里,我感觉脑洞大开后就合不上了人家都是“合不拢嘴”,我现在是“合不拢脑”

陶醉之余,有了这样的图:

“醉后不知天在水,满船清梦压星河。”


醉后不知天在水,满船清梦压星河。V4


醉后不知天在水,满船清梦压星河。V5

我用V4和V5各出了几组,虽然V5更真实,但我觉得V4的意境更好,两组都喜欢。

3

在对自己大脑狂轰滥炸了N天后,最初的新鲜劲儿总算过去了。

在这期间,我又看了很多脑洞大开的作品,有的特别有趣,有的很感动。尤其是这组过世名人的自拍照。


过世名人自拍


过世名人自拍


过世名人自拍


过世名人自拍

这组作品真让我感动,我想,AI目前还没有感情,但人是有感情的。人从AI作品中获得的感受,其实是人自身情感的投射,可能是来自我们内心深处的需求和渴望:平等尊重,知识视野,仁慈宽容。也就是说,我们通过AI作品看到了我们自己。

我真希望以后这些AI生成的形象能动起来,也许我们能和他们互动,听他们讲故事,或者逗逗猫狗,或者让作品里几个形象演场戏,也许会有一种新的媒体格式承载这一切,自己画完了或者网上刷到了,马上就活了,就能动起来。期待吧,以后人人都是神笔马良。

4

差不多快一个月时间,每天都会自己试试,看看他人作品。这些天我感觉自己经历了一场加速的审美疲劳过程,以前那种由电影、游戏、动画、摄影等等形式制造的感官奇观和大场面仿佛冲击力减弱了、甚至消失了,正在褪色,同时很多优秀的人类大脑和富有想象力的作品又快速涌现出来,真是太好了,不得了。

一方面普通人敲敲键盘、点点鼠标就能出视觉奇迹,另一方面能抓住人好奇心想象力的作品大量涌现,而且品质更好,还相对更容易制作。这两个过程正在同时快速出现,真的变了。

以后感官享受的内容大爆发,获取也越来越容易,不知道会不会对电影、游戏等这些娱乐行业有影响,就像短视频流行对文字内容的影响一样:反正我觉得刷刷手机就能获得和电影、游戏类似的乐趣,而且有的还更有意思、更能引发好奇心、更有想象力(比如几幅AI图片就能获得一部伪纪录片差不多的视觉品质、同等甚至更大的脑洞),我多少会有一点懒得看片打游戏了,当然完全取代也不可能,但一个更容易获得的感官刺激我想多少会对现有的娱乐形式有影响吧。

其实,我猜测可能会出现这种“更容易制造、获取的感官享乐和现有的娱乐形式争夺注意力”的局面,也是因为现有的娱乐形式越来越审美疲劳,至少我自己感觉,这种疲劳感已经存在至少二十几年,只是这几天明显加速了。特别是看了几个不同版本的prompt提示词大全后,我发现这就是我们日常娱乐的主流部分了。

5

没过两天,就看见“美国科技人士呼吁暂停训练更强大的AI”的话题。当时觉得很夸张,“暂停6个月,公开,可验证”,就差“承诺不首先使用”了

我是觉得,他们诟病的问题在AI出来之前早就有了,又不是新近出现的,有什么可大惊小怪的。

尤其是看到近期发布的firefly,我感觉从使用者角度看,PS=>firefly=>midjourney无非就是个手动-半自动-全自动的区别,midjourney可以垫图也可以全自动生成,后面一串prompt跟ps命令和滤镜也没什么区别。

我感觉,比AI更可怕的是一些人的心智,在这样一个信息爆炸的时代,一个人仍然缺少辨别能力、缺少怀疑精神、不能通过来源把握信息真实度、自大、盲从、迷信、没有自知之明、缺少自我批判精神,这样才是更可怕的。

前几天看到一个视频采访(好像是崔娃的一个采访视频),采访对象是AI专家,说要给AI一个“围栏”,限制它什么不可以生成,比如名人。我觉得这才是他们该做的,但很可惜,目前为止这个“围栏”还没出现。如果那些训练AI的人不教它认识名人,(至少目前)它怎么知道谁是谁,这种事就是教什么有什么。或者一开始就应该预见名人形象有被滥用的风险,但现在也没有应对行动。

6

这是这篇文字的最后部分,想把midjourney 和游戏做做比较。

我这半个多月玩midjourney真的很上瘾,对我而言,与其说它是一种设计工具,倒不如说是一种游戏:我感觉玩midjourney就像是在玩游戏,同时它似乎像游戏一样激发了我大脑的奖励机制。

在我看来,Midjourney每次都能轻松生成品质很高的图,每一次生成这些图片,都是一种可预测的正面结果,就像玩游戏通关一样,我想大脑同样会释放一些化学物质,比如多巴胺,刺激大脑的奖励中心,产生一种愉悦的感觉,同时,这种感觉会激励我不断调整描述词,以达到更符合期望的结果,就像游戏不断提高排名或分数,如果几经尝试生成的图和我想象的一模一样,那种满足感就是最高的。不仅如此,midjourney每次生成的图片又是不可预测的,对未来和结果的不可预测性是它另一个让我着魔的点,甚至比结果本身更让我着迷。

这种可预测性和不可预测性的共同作用,让出图这一过程不断反复循环,真就玩游戏一样让人上瘾。