AI Art(AI作画)在C端的爆发,比我们想象中来得更加迅猛。
仿佛是一夜之间,小红书、抖音上出现了大量的AI艺术作品,也足以证明国内市场对于新兴事物的洞察力、产品技术能力,与国内用户娱乐文化需求之间的缝隙正在慢慢缩小。
而这之中,几个月前上线的文生图(Text To Image)工具「盗梦师」,可以说是热度最高的产品之一。
「盗梦师」所在的AIGC厂商「西湖心辰」成立于2021年,依托于新型研究型学术机构西湖大学,专注于人工智能自然语言处理领域的科研成果转化及产品应用等,2021年年底完成了近千万美元的天使轮融资。
「西湖心辰」AIGC产品版图的第一步并不是AI Art,而是文本生成工具「Friday AI」:用户输入一个标题,就能生成一篇文章。目前,「Friday AI」已经为数十家企业提供了服务,为「盗梦师」打下了ToB的基础。
“AI作画其实我们很早就想做了,一直在等待一个技术和商业的契合点。”
「盗梦师」创始人蓝振忠告诉36氪, Diffusion方法出现之后,AI Art的生成速度被大幅提高,也让他们终于看到了在这一赛道推出产品的可行性。
从今年3月份开始布局技术,到8月开发上线,仅仅不到几个月的时间内,「盗梦师」已经拥有了接近100万名用户。
“未来,会有一个更大的AIGC平台”
近十年来,人工智能一直在试图做出像电影《Her》中的AI伴侣一样精密的“智能制造”产品,它就像AI时代的汽车一样,融合了一个个元件与模块能力,最终为人类呈现出流畅而强大的交互体验。
在蓝振忠的描述下,未来,「盗梦师」也将作为一个功能模块,融入他们想要打造的AI助手平台。除了已经上线的文生文、文生图工具之外,「西湖心辰」正在打造文生视频(Text-to-video)的技术产品,这也是目前AIGC行业最聚焦的技术方向。
「盗梦师」文生视频效果
作为一家初创公司,100万用户这一数字在国内AI Art行业无疑已经处于领先地位。目前,无论是国内市场还是海外,由于GPU的成本和技术限制,大多数AI Art产品仍然处于社区和测试阶段,每天生成的图片上限、能够容纳的用户数都有限,而「盗梦师」却在上线的第一个月就支撑起了20万用户的创作体验。
蓝振忠介绍道,AI Art和AI写作一样都需要使用大模型,需要更高的算力,而GPU的高成本问题也是AIGC的早期发展难点之一。其他厂商还在想办法怎么“找到这批机器”、优化运算速度的时候,来自「Friday AI」的长期技术积累,已经帮助他们解决了这一问题,从而使得「盗梦师」能够更快向C端开放、抢占市场红利期的技术壁垒之一。
另一个核心竞争力来自如何提高生成速度和单位效率。
“一下子涌进来这么多用户,我们要确保计算速度能控制在几秒之内,想办法在单位时间内服务更多的人,才能让C端用户有比较好的体验。”
以「盗梦师」的主要C端场景微信小程序为例,作为一个超级应用中的子页面,用户对于小程序的耐心非常有限,往往是一旦切出去就很难再回来了,因此生成速度对于用户体验和留住用户来说至关重要。目前,「盗梦师」无论在算法还是产品上都已经呈现出了“相对成熟”的特点,理论出图速度已经能达到0.8秒/张,领先于业界。
审图速度是另一个“出图速度”的考核维度。尤其在中文语境下,不断更新的审核内容为用户体验增加的实际时间成本也需要被考虑进去,而「盗梦师」已经将审图速度控制在了1-2秒之间。除此之外,「西湖心辰」也正在打造相应的智能工具,帮助AIGC厂商更加快速精准地完成内容审核。
“现在,已经有不少B端用户在调用我们的API了。”
在蓝振忠看来,ToB的商业化路线要比ToC更清晰。尽管近几个月来,科技巨头们也在积极布局AI Art工具,如百度文心、阿里达摩院等,但市场竞争规则和大厂的“产品矩阵”习性,也会导致他们的平台可能会先专注于服务好自有生态、无法更好地拓展到其他平台。出发的角度不一样,切入的场景也会有所不同。
既是工具,也是每个人都可以“玩”的社区
“从短期来说,我们想做一个大家都可以“玩”的工具。”
蓝振忠表示,「盗梦师」一方面会努力将“玩”的属性发挥到极致,做出大众化的产品;另一方面也会去开拓作为工具的属性,覆盖更专业的需求,比如目前一个镜头可能要画几天的导演分镜,或者插画师、游戏从业人员等。娱乐与专业化的需求,既能够共享同样的AIGC能力,又会有设备环境、产品功能等方面的区分,比如「盗梦师」针对C端用户“更多地想基于小程序等轻应用环境中”,而B端则主打PC版本。
「盗梦师」微信小程序界面
而从长期目标来讲,「盗梦师」未来希望能够做成一个社区,从艺术、视觉、设计等垂类领域进行深入探索:“大家都会来这里交流和学习怎么画画,不但能够画出自己想要的东西,也能建立自己专属的模型”。
一个开放的社区,意味着更高的用户定制化和更密切的交流。目前,「盗梦师」已经运营起了几十个用户微信群,拥有不错的活跃度。
团队方面,「西湖心辰」拥有数十人,分为算法、工程、产品、市场等团队,核心成员来自微软、谷歌、百度、阿里、华为等大厂。创始人蓝振忠博士拥有卡耐基梅隆大学(CMU)人工智能博士学位,现任西湖大学博士生导师,曾任谷歌人工智能研究院科学家及多家企业的首席科学家,同时也是NLP轻量级预训练语言模型 “ALBERT” 第一作者,曾联合推出中文预训练语言模型评价基准 “CLUE”。
开源的环境中,当下的变现能力不再能够和产品技术完全等同起来,也就催生了一批投机主义者。
“早期的混乱是不可避免的,但在我们这个领域,几乎所有一次性收费、终身收费的产品都是为了割韭菜。”
蓝振忠反复强调,想做好一个AI Art产品,不应该过度着眼于短期利益。近期,「盗梦师」与手机天猫合作,为AI Art向B端服务演进又迈出了一步,而在C端方面,和大多数AIGC厂商一样,「盗梦师」仍在探索一个长期主义的商业模式。
但想象力无疑是巨大的。
“智能手机的出现让更多的人有了创作短视频的能力,从而出现了抖音这样的内容消费平台,可创作依然是少部分人的专利。未来我们想要做到的就是,只要内心有故事,人人都可以当导演,人人成为当画师。”
未来,对于创作本身来说,每个人“只要有梦想,就可以去呈现”,而对于像「盗梦师」一样的AIGC产品,也将有机会在更大的创作价值中,得到长期主义的回报。