Midjourney的风格是简单、直接、高效,所有精力集中在模型上,不做app,也不做网站。

如今,不知道Midjourney这家公司,似乎就不配谈AIGC。

不久前,AI绘图工具Midjourney发布了第五代V5模型,由它生成的一张“中国情侣”图片因效果酷似真人而火爆出圈。紧接着,又进一步宣布推出针对二次元、动漫风格的版本。

新版Midjourney,用户使用风格化命令,就能轻而易举地生成大师级作品。以高频迭代速度不断优化使用体验,一时间,针对Midjourney的极简入门法则、使用攻略、进阶玩法、变现指南等在网上被广泛传播。

大量新用户的涌入,再加上GPU临时性短缺,导致Midjourney付费用户的服务陷入了瘫痪。为此,公司只好叫停免费试用。

有机构用“产品效果惊艳”评价Midjourney。作为文生图领域的“领跑者”,Midjourney由David Holz创立于2021年8月,仅拥有11名全职员工,成立至今未融过资,却凭借着付费订阅的商业模式,实现年营收1亿美元。

就是这样一个仅有11人的小公司,没有任何外部重金投入,却成为AI绘画领域的“当红明星”,甚至将同类型的公司都甩在其后。

现如今,Midjourney在聊天软件Discord上已经积累了将近1500万用户,这家公司也成了了解AI绘画无法绕开的公司。

01 创始人曾两次拒绝苹果

“我们没有压力销售什么东西,也不用成为上市公司,只是为了未来十年能够有一个家,可以从事很多比较有意义的、酷的项目,希望不仅是对我,还是对世界有意义,并且享受乐趣。”一年半前,Midjourney创始人David Holz在接受媒体采访时表示。

在David Holz的蓝图中,他要打造的是一个“想象力引擎”,他认为想象力是人们在世界上所需东西的重要支柱。而同时,人们可以把AIGC变成一种力量,扩展人类的想象力。

图源:Midjourney官网

Midjourney官网上,关于David Holz的此前经历的介绍非常简洁:Leap Motion创始人;NASA和Max Planck研究员。

图源:Midjourney官网

"这很Midjourney。”一位AIGC领域创业者说,它的风格就是简单、直接、高效,就像他们做产品的思路一样:“所有精力集中在模型上,不做app,也不做网站。”

高中时期的David Holz感兴趣的是设计,也做过设计生意。上大学后,他学了与设计几乎不相干的物理和数学。研究生期间,他希望能选择与现实有关的专业,于是读了应用数学专业。之后,他又攻读了流体力学博士。

创业的想法很偶然。“有一次我不知所措,把所有的事情放在一边。所以我搬到了旧金山,创办了Leap Motion。”David Holz曾在接受媒体采访时说。

Leap Motion成立于2010年,彼时VR、AR行业还未开始火热。两年后,极具极客气质的Leap Motion控制器诞生。这个看起来像U盘一般大小的盒子尽管看似毫不起眼,但一经展示便立即吸引了大量的关注。

这个控制器内装有多种传感设备,能追踪到小到0.01毫米的动作,当你把手放在它正上方,便可以跟踪十指动作,并借助计算机视觉技术,让你的手部动作投射在虚拟空间中。

这款充满着想象和憧憬的产品推出后,Leap Motion一炮而红。2013年经过B轮融资之后达到巅峰状态,估值达到3.06亿美元。

彼时,苹果的AR项目还在初期,希望通过收购将优秀的团队和项目整合到自己的项目中。然而理念的差异让苹果吃了闭门羹。这是David Holz第一次拒绝苹果。

五年后的2018年,Leap Motion已没有昔日的名气,但技术实力依然不弱。接到苹果再次邀约之后,双方开始了谈判,但在交易进展到尾声阶段时,收购再一次叫停。

在之后的公开报道中,David Holz间接解释了拒绝苹果的原因,他认为苹果已经失去了创造力,甚至直言:“我永远不会为那些家伙工作,他们是魔鬼。”

最终在2019年,David Holz以3000万美元将Leap Motion卖给了竞争对手UltraHaptics。

Midjourney是David Holz在AI艺术领域探索新机会的产物。

后面的这次创业,David Holz没有融资,但靠“刷脸”解决了Midjourney算力问题。

据报道,David Holz给一个云供应商的负责人发邮件,希望对方提供10000个GPU。很快,Midjourney获得了云供应商的支持,原因便是他们了解到David Holz,知道他以前的创业经历。

02 低使用门槛抢占用户心智

“相比其他同类产品,Midjourney的Prompt简短,用户门槛低。”一家第三方研究机构在其报告中写到。

Midjourney使用起来极为简单,注册Discord账号之后,即可进入Midjourney频道,随后可以加入公测服务器。使用时,用户只需要输入命令提示符,就可以生成对应的高品质图形。它可以让用户避开复杂的使用技巧,同时可以用算法让机器想象你输入命令的样子。

这也是Midjourney能够脱颖而出的地方。凭借简单的Prompt,Midjourney借助Discord社区持续迭代,社区用户将近1500万。

图源:Discord

一位Midjourney使用者告诉全天候科技,Midjourney给人的感觉是用起来简单而且无约束,“有一种不可思议的力量和流动,就像一款能让我上瘾的游戏。”

而在前述AIGC领域从业者看来,Midjourney拥有游戏的所有元素:能够让你想象任何实物的可靠核心圈层,魔咒一般灵巧的指令符,以及基于社区的开放文化。

Midjourney生成的人物图图源:推特账号Nick St. Pierre

为何不直接做一个iOS拍照应用?而是选择Discord用户界面。最初其实是因为Midjourney团队是一个远程工作的团队,所以建立了一个机器人。

后来,团队用同样的机器人在 Discord 上做了一个用户测试,得到的结果是:用户很喜欢这个实时交流想法,富有想象力的环境。这也让David Holz看到了Discord体验的神奇之处。

“我们发现人们真的喜欢一起想象,所以我们让Midjourney更具社交性。我们有一个巨大的Discord社区,用户在这些共享空间中共同想象。”David Holz曾在公开采访中表示。

他认为,人们想要一起做事情,如果是在iOS平台去做,就必须做自己的社交网络,这非常困难。但相反,如果用户想要自己的社交体验,Discord是很好的选择。

作为一款适用于游戏玩家一体化语音和文字聊天软件,Discord平台的社交属性也让Midjourney抢占了更多的用户心智。“它在Discord上更像是一个艺术AI的社交空间,能够让它易于迭代、学习、发现和发展。”上述AIGC领域从业者说。

换言之,Discord社区生态帮助了Midjourney的推广。反过来,庞大的用户能够根据自身需求针对性地训练模型并快速迭代产品。

作为AI绘画领域的两个“领头羊”,人们总会把Midjourney和Stable Diffusion放在一起对比。

对比而言,Stable Diffusio是一个免费开源的模型,完全免费、不限次数、任何人都可用的。因而,Stable Diffusion的优势在于其无需任何成本即可使用。

同时还可以在GitHub上找到完整的源代码和文档。另外,开源前提下,模型代码迭代的速度也增快,优化效率高于闭源模型。

但缺点也显而易见:如果没有其它护城河,商业化问题难以解决,很容易成为别人前进的垫脚石。

而Midjourney则需要付费使用。和大部分软件类应用类似,Midjourney采用付费订阅的模式,按月向用户收取费用,共有3种收费套餐:10美元/月、30美元/月、60美元/月。

图源:Midjourney官网

相较而言,收费模式容易劝退用户,在社区支持和维护方面也逊于开源的Stable Diffusion。

然而,相对封闭也成为Midjourney构建自身护城河的重要方式。因为没有公开其源代码,因此无法被广泛地研究、改进和应用,Midjourney积累的数据集具有独家性,可以进行针对性训练。

Midjourney的成功或许包含了多种因素,比如:清晰的目标定位,快速在一个仍然混沌的市场中找到合适的产品形态;专注在有价值的具体业务方面,迅速形成技术优势;找到一个有充沛流量的场景Discord,实现低成本获客,低成本营销等。

想象力的空间已经打开,AIGC的竞争越加激烈,Midjourney 还能赢在未来吗?