(使用Midjourney生成,Prompt:Power)
如果要说现在最火的文生图,不得不说到Midjourney,它根植于Discord社区,也因此我们聊的时候会结合Discord对它进行展开探讨。
坦率说,当下国内并没有看到一篇真正琢磨Midjourney的文章,更多是媒体报道,在这里Super抛砖引玉,基于少量的使用体验+思考,希望能和大家一起拨开迷雾,找到对的方向。
本文分为以下几个部分:
01. Midjourney简述
一. Midjourney是什么? 二. 创始人David Holz 三. Midjourney欲向何方?02. Discord造就Midjourney 一. Discord是什么? 二. 为什么是Discord造就Midjourney? 三. 基于Discord的Midjourney为何能大火(
增长回路)03. Midjourney商业模式04. Midjourney给我们的启发
一.Midjourney是什么?
Midjourney is an independent research lab exploring new mediums of thought and expanding the imaginative powers of the human species.
We are a small self-funded team focused on design, human infrastructure, and AI. We have 11 full-time staff and an incredible set of advisors.
Midjourney是一个独立的研究实验室,探索新的思维媒介, 扩大人类物种的想象力 。
专注于设计、人力基础设施和人工智能。
这是它们官网的介绍,我们现在可见的是文本生成图片的产品,未来产品形态还是可能会出现变化的。
首页里的第一个按钮““Join in the beta”,直接会跳转到它们在Discord上的频道:
截至目前已经有381万用户加入它们的Discord频道。
大部分工作Midjourney都通过Discord来完成,比如最核心的bot:
用户主要通过Discord的bot机制,通过提交Prompt(提示词),获得图片。
Midjourney也通过bot机制来完成一些其他工作,比如:
-
将用户生成的图片同步到官网的个人中心;
-
通过官网收取订阅费,再对用户授予使用次数;
后面会简单阐述下Discord,方便大家更好地理解Midjourney和Discord是如何共生的。
二.创始人David Holz
Previously: Founder Leap Motion, Researcher at NASA, Max Planck
David Holz :我的名字是David Holz,是个连续创业者。简短来说,我的经历是:我在高中的时候做过设计生意,大学学的是物理和数学,我在NASA和Max Planck工作的时候攻读了流体力学博士学位。有一次我不知所措,把所有的事情都放在一边。所以我搬到了旧金山,在2011年左右创办了一家名为Leap Motion的科技公司。我们销售那些可以在手上做动态捕捉的设备,创造了很多手势界面空间。
我创立了Leap Motion并且经营了12年,(但)最终,我希望寻找一个不同的环境而不是一家风投支持的大公司,我离开并创办了Midjourney。现在,它的规模还很小,我们只有10个人, 没有投资者,而且我们也不是以财务回报为动机的 。我们没有压力销售什么东西也不用成为上市公司,只是为了未来十年能够有一个家,可以从事很多比较有意义的、酷的项目,希望不仅是对我,还对世界有意义,并且享受乐趣。
【注意,当前资本很热的情况下确实并未看到Midjourney融资的新闻,并且我猜测付费率应该能过5%(早期全球范围内几乎独此一份),也会带来一个月200万美元以上的收入,个人觉得没有必要拿融资。】
他对于Midjourney的理解大体是这样的:
“ Midjourney不光是想象力的引擎 ,往未来迈一步,如果不是一次拍摄几张照片,而是一次拍摄几万张照片,面对这一切,我会感觉自己就像是小孩看着水池的深处,知道自己不会游泳,却能感觉到水池的深度。
AI就是水,人们把它看成老虎,这是错的。水也有危险,但水也是文明的驱动力,如果人类能知道如何与水共处,会过得更好。
Midjourney是一股新的水源 。”
这一段有点韵味,建议翻到文末看一下TheVerge采访的原文感受一下。
三. Midjourney欲向何方?
We’re working on a lot of different projects. It’s going to be a wide and diverse research lab. But there are themes: things like reflection, imagination, and coordination. And what we’re starting to become well known for is this image creation stuff. And we don’t think it’s really about art or making deepfakes, but — how do we expand the imaginative powers of the human species? And what does that mean? What does it mean when computers are better at visual imagination than 99 percent of humans? That doesn’t mean we will stop imagining. Cars are faster than humans, but that doesn’t mean we stopped walking. When we’re moving huge amounts of stuff over huge distances, we need engines, whether that’s airplanes or boats or cars. And we see this technology as an engine for the imagination. So it’s a very positive and humanistic thing.
Midjourney在做很多不同的项目,但是创造图像这个工作让他们出名了。
我觉得他们肯定会在这个有着强烈需求的方向上继续拓展,包括可以看到他们也在招聘相关的人才来扩展:
但相信有了足够的资金后,他们还是会在“things like reflection, imagination, and coordination”方向上探索种种可能性。
“A lot of people ask us, why don’t you just make an iOS app that makes you a picture?” Midjourney’s founder, David Holz, told The Verge in an interview. “But people want to make things together, and if you do that on iOS, you have to make your own social network. And that’s pretty hard. So if you want your own social experience, Discord is really great.”
为什么是Discord?创始人Holz在回答为什么不做个iOS App的时候,说到,如果我们想做一个自己的社交网络,非常难,但我们想让大家一起创造,从这点来说,Discord非常棒的实现介质。
这种选择很好的帮助了Midjourney快速成长,在继续展开前,我们最好先理解一下Discord是什么?
一.Discord是什么?
Discord是2015年上线的,最初主打游戏语音连麦,基于Voip技术,由于多端支持(特别是支持网页端)、免费、上手门槛低,然后语音清晰、延时低、连接稳定这些特点,逐步获得用户的认可。
疫情之后,由于Discord的社区功能,从游戏领域破圈,比如,他成了欧洲大量高校的线上教学工具:
图源知乎
我们可以理解,Discord的本质是一个社区,语音只是他的主打功能之一。
Discord的两位创始人表示:“Discord与大多数在线社交工具完全不同,它没有游戏化系统,没有追随者人数,没有算法推荐。它就是创造了一个地方,让你感觉就像你的朋友就在身边,你遇到他们并与他们交谈、闲聊。”
你可以非常便捷的创建服务器,在服务器上设立不同的频道,可以理解为频道是不同的主题房间。
另外一个很关键的点是,Discord有Bot,你可以把它理解为机器人,或者插件,允许第三方在Discord提供的接口下独自开发。
这极大的扩展了社区的功能,也增加了用户的粘性,并且支持开放邀请Bot加入频道的功能(Midjourney也支持了邀请功能)
Midjourney通过在Discord上创建了自己的服务器,并创建了大量的频道,以及开发了自己的机器人,来向用户提供服务:
二.如何在Discord里使用Midjourney?
我们进一步,简单来和大家分享一下如何在Discord里使用Midjourney,这样一些无法访问的朋友可以更好地理解:
首先还是要注册一个账号,然后进入新手的newbie频道就可以快速生成图片:
在newbie频道,“/”可以掉出所有的命令:
当你输入/imagine +提示词,再回车后,就相当于把Prompt提交给了bot,接着会进入生成过程:
会有个从模糊到清晰的图像生成过程和进度给到你,
完成后会让你从4张图中选择,注意此时还没有结束,你可以从4张图中选择一张来 U(Upscale,放大像素并提升细节) ,或者 V(Variation,基于所选图片来延伸变形) ,1~4代表着左上到右下的4张照片。
比如我点击了V4之后,bot又进入了一次新的图片生成过程:
这里面,我觉得第二张黑色的太阳不错,
点了U2:
然后就生成了最终的图,当然你还可以做变形、用网页打开原图,以及给出你的反馈,是惊喜还是失望,等操作。
我点击了Upscale to Max,把清晰度拉满,最后生成了:
以上就是生成图片的过程。
每个新用户会有一些免费点数,使用完后,Bot会提示你,该交钱啦:
这一部分在后面的商业模式部分会再展开,现在先跳过去,我们下面来聊聊本节标题,为什么是Discord造就Midjourney?
三.为什么是Discord造就了Midjourney呢?
首先, Discord是一个共创的土壤 。
Inside the community, you have a million people making images, and they’re all riffing off each other, and by default, everybody can see everybody else’s images . You have to pay extra to pull out the community — and usually, if you do that, it means you’re some type of commercial user. So everyone’s ripping off each other, and there’s all these new aesthetics. It’s almost like aesthetic accelerationism. And they’re all bubbling up and swirling round, and they’re not AI aesthetics. They’re new, interesting, human aesthetics that I think will spill out into the world.
Holz说,个体的想象力是有限的,但我们发现把人们放到一起,大家就会想象力爆棚,所以我们需要创造一个Midjourney的社交,它就是基础设施:Discord。
在社区里,大家都在互相模仿,相当于提供了一个共创的土壤。
如果用户愿意付出 额外费用 脱离社区自己玩,也恰恰说明他们是特殊的商业客户。
我们来看看Discord可以做什么:
公告区 ,创始人Holz发布了一个公告 ,请付费会员对新的V4算法产出的图片质量做一个评分,发动群众,相当于最后系统会借鉴用户评分去调整模型的生成倾向。
不同的主题频道 ,可以把喜好不同的付费用户分流到不同的频道内,帮助用户之间更好的形成共创。
其次, Discord有广泛的用户基础 。
在今年7月底,负责Discord社区运营的高级经理戴(Mindy Day)表示, Discord月活超过1.5亿 。
广泛的用户认知也大幅降低了导流转化的成本。
包括前面说的Discord支持多端访问,Super自己都是直接用网页版本访问Midjourney频道,也很流畅,这种体验的优秀也保证了用户的使用感受。
最后, Discord的Bot机制可以帮助Midjourney很好地完成服务 。
刚才我们介绍过了Bot机制,这里再做个简单的总结:
-
用户给Bot发送Prompt;
-
Bot监测用户的付费情况(以及图片生成额度情况);
-
如果有限额,Midjourney在后端直接生成图片并通过Bot返给用户;
-
如果无限额,提示用户付费。
由于Discord的这些因素,Midjourney可以持续的快速增长,只需要维护好Bot,以及后端服务即可,大量的降低了其他部分工作量,可以用极少量的员工支持大规模的用户。
四.基于Discord的Midjourney由于什么爆火?
《Théâtre D’opéra Spatial》
8月底,美国科罗拉多州博览会的美术大赛公布了获奖结果,一幅名为《太空歌剧院(Théâtre D'opéra Spatial)》的作品在“数字艺术”类别中摘得了桂冠。
这幅图无论是主题、光影、人物、色彩在专业人士眼中都算得上是上乘之作,然后被爆料是作者使用AI生成的( 其实是Ai生成后精修的 ),被人质疑合法性、公平性,并和艺术可能会消亡挂上钩。
这引起了轩然大波,当然,Midjourney就是这个新闻背后的AI。。。事实上也带来了海量的用户。
根据报道,Midjourney在8月底应该只有30万左右用户,到了9月底就达到了150万+,说明8月底这次美术大赛事件对他们用户增长带来的巨大增长。
再加上前面说的用户使用门槛最低(只需要加入Discord,输入Prompt),简单、效果好、超级牛逼的冷启动,使得它破圈了,再加上本身基于Discord建立的社区不断地鼓励用户共创、增加了粘性,这个增长回路使得Midjourney不断地爆发:
得益于Discord的社区调性、Bot机制实现的共创效果、以及Midjourney生成的高质量图片抓人的眼球,进而带来的用户传播自增长,这几个部分共同构成了Midjourney的持续增长。
到今天看到的数据用户总数已经破380万。
当然我们也要知道,主动退出Discord的用户毕竟是少数,380万可以算是一个累计用户数(虚荣指标),不过最近登录Discord,我也发现基本能看到的在线用户数都在30万左右,在某种程度上来说,这个用户活跃度还是很高的。
另一个角度,Midjourney和Discord互相成就,Midjourney也是Discord上用户数量最多的服务器。
对于新用户,Midjourney给了一个25点的免费额度,用完后则需要购买。
购买有两档套餐,标准用户套餐是:
10美元的月度会员支持生成200张图,大概就是一张图3毛钱。或者30美元就不限制使用量。
订阅会员才能进入会员画廊,妥妥的会员权益呀。
What is the member gallery?The gallery is a place where paid members can explore images being made on the platform as well as visual dictionaries of words and styles. The gallery also acts as a central place to organize your own images, collect favorites, and more.
对于普通会员来说,默认你的图和Prompt是会被公开的,如果你不想公开,就得买一个50美元/月的隐私通道。。。
另外就是合作伙伴计划,如果你想在超过100万美元年收入的公司使用图片来商用,那就得买这个,一年600美刀。
这么看起来,Midjourney在收费策略上还是很大胆的,少量的免费额度让你体验,一旦用完,就必须买,不然没得玩。
售卖的策略是订阅制,而不是国内通常的按使用量付费。
这个模式的成立Super估计得益于几点:
-
高出图质量;
-
优秀的共创氛围;
-
媒体的渲染和优秀的用户自传播;
-
超低使用门槛;
-
先发红利;
-
全球市场;
-
海外用户对于付费和订阅制的接受;
产品力三角形
Midjourney的商业模式可以再简单展开聊聊,我们借用产品力三角形来做个描述:
使用价值 :Midjourney可以快速的简单的生成高质量的图,并且提供了图片层面的选择和变化。
附加值 :社区对于Midjourney来说是一个挺高的附加值,这实际上构成了附加值。又由于Midjourney先发,门槛低,大量的用户可以快速便捷的生成图片,再拿到社交网络Show,也是附加值的一种: 炫耀 。
价格 :这个价格实际上在国外也不算高,订阅制大家也普遍的能接受。
所以整体来看,Midjourney的三条边拉的都还是挺好的,唯一的问题就是随着时间的推移,使用价值和附加值能不能持续下去存疑。
包括竞品增多之后,价格也可能会不再有足够的竞争力。
值得观察。
结合国内几款文生图的产品一起来看一看:
第一. 媒体红利和先发优势很重要 :
竞品很多,如何在正确的渠道用正确的方式宣传,决定了可以获得多少用户和流量。
那在对应的渠道里,用什么方式,如何导流,就很有讲究了。很多团队更多是技术基因,在于借势这一块就会存在天然的缺陷。
第二. 社区是促活和提高用户粘性的关键 :
接着,流量来了,如何留住,变成留量也很重要。
因为如果单纯只是一个工具,完全没有前景,因为大家都是基于SD开源做的少量差异化,构不成竞争优势,随着入场玩家逐渐增加,就会面临用户流失和获客困难的挑战。
Midjourney直接把用户导入到社区化的Discord内是很关键的一步。
国内通常使用的策略是微信群,这也面临很多限制,最大的限制是单个群人数又很低的上限,无法直接把上万的用户装进来。
同时微信群内也不能很好的支持机器人。
对于群的运营机制如果没有找到好的策略,会导致要么很消耗运营精力,要么效果很差慢慢变成死群。
有些小程序会把用户生成的图放出来,画廊或者艺术展的瀑布流方式呈现,但很多时候Prompt也不公开,其次是没有分类,实时性也很欠缺。促进用户生产内容的效果很有限。
第三. 大胆的付费策略 :
Midjourney不提供免费排队通道,上来就直接付费。当然这个和竞品稀少有很大关系。
国内要么是按使用量付费,要么是几乎免费,大家还是处在一个 先获取用户,再获得融资的toVC 策略。
坦白讲,这是一种自作聪明的做法,即使现在资本对于AIGC方向很看好,热钱涌入,但一旦后面风口过了,即使你拿了大笔的钱,一样会死的非常快。
背后的逻辑很简单,完全没有健康的商业模式,并且用户免费习惯了,转到付费的情况也会非常的低。
最近可以看到一些拿了融资的、想拿融资的,各种PR,Super看了是皱眉头,用近乎免费的策略换取用户,再拿用户数去要融资,这是非常不健康的。
且行且珍惜吧。
下一篇,我想写一下当前AIGC方面的共识,共识的背后其实非常需要大家思考什么才是非共识,欢迎关注。
对了,Super拉了一个AI的微信群,欢迎大家加我: lookforward ,拉你入群,有个强制要求是一周内必须需要有互动。