一场始于艺术的“风暴”,已经席卷到了一级市场。8月,由AI创作而成的绘画《太空歌剧院》在一场艺术大赛中获得头奖,一时间全球哗然。当人们讨论“画师会不会因此失业”时,VC却嗅到了机会。
9月,红杉发表了一篇题为《Generative AI: A Creative New World》的文章,盛赞“生成式AI”巨大的商业应用潜力,且很快会出现“杀手级应用”。而该文的署名作者GPT-3,正是个生成式AI。
生成式AI的主要功能是创作内容,包括绘画、文章、音乐等等,走的是文艺青年路线。而过去人们所熟知的多是分析式AI,擅长各类数据分析工作,是一个木得感情的运算机器。AI从“工具人”摇身一变,开始大搞艺术,催生了一个全新的领域——AIGC,即AI内容创作,眼下极具话题度的AI绘画正是其中一个赛道。
随着红杉等头部VC对AIGC愈发关注,原本曲高和寡的AI产业也热闹了起来。这些翻天覆地变化的背后,AI产业到底经历了些什么?
进化:AI的革新
AI绘画之外,更多其他类型的AIGC产品也在走入日常生活。前些日子,著名AI实验室OpenAI推出的AI聊天机器人ChatGPT爆红,上线五天已有100万用户。它是开头提到那位AI写手GPT-3的升级版,内容风格更适配聊天场景。从写作、绘画,再到聊天,AIGC迎来了井喷期。
当下种种繁荣,是AI产业近十年积累产生质变的结果——更强大的工具、更优秀的模型,以及更丰富的数据,三者缺一不可。
在工具端,随着AI产业逐渐挖掘出GPU的潜力,AI研究成本得以大幅下降,成功摆脱了“只烧钱不赚钱”的瓶颈。
此前AI产业主要使用的工具是CPU——特长是复杂的运算,但单个CPU效率不高。所以2012年AI科学家吴恩达搞研究时,需要同时用上16000个CPU,约等于四五十个网吧的规模,花掉了足足100万美元成本。但研究者们后来发现,AI运算实际相当简单,用“高智商”的CPU实在屈才。
相比之下,GPU虽运算能力弱,堪比“三年级小学生”,但在AI领域完全够用;更重要的是,GPU的效率极其拔尖。吴恩达后来算了笔账:如果把当年实验的工具换成GPU,只需要12个,成本骤降。
此前,AI产业曾两度步入黄金时期,又两度陷入停滞——第一次遇到的问题是算力不足,第二次是成本过高。但GPU的出现,堪称一石二鸟:不仅成本更低,且算力仍能保持周期性提升,这构成了新一轮AI黄金时代的基石,也替AI模型快速迭代提供了基础条件。
AI模型是各种应用构建的地基。近十年,AI模型屡屡迎来技术性突破,成功让AIGC从科幻小说照进现实。例如2015年,谷歌在一篇革命性的论文中,介绍了全新发明的transformers神经网络架构——而这正是GPT-3和ChatGPT的基础。至于讨论最多的AI绘画,其模型更迭速度更快:
2014年,吴恩达的学生Ian Goodfellow有了重大突破——他设计出了生成式对抗网络GAN。其原理简单来说,是给负责创作的AI增加一个“审核员”,让创作者和审核员互相内卷,以此生成更高质量的绘画。这套模型后来被广泛使用并不断改良,其作品后来更通过了著名的图灵测试——这意味着AI已经初步具备人类智能。
2021年,OpenAI实验室又更进一步,开源了全新的深度学习模型CLIP——其颠覆性在于,AI变得能够将图片和文字,这两个不同维度的数据关联在一起。
CLIP的意义相当重大:过去种种AI绘画模型,多是依靠输入海量图片数据来生成绘画作品;CLIP的出现,意味着人们可以通过输入关键词来生成对应图片——而这正是如今席卷全球的AI绘画应用的地基。
CLIP模型的“魔力”,是经由40亿个具有文字标签的图片数据反复训练的结果——这些数据全部搜刮自互联网的各个角落。日益浩瀚的互联网数据海,构成了AI产业快速发展的第三个条件。
上述三重Buff加持之下,AI行业一脚油门驶上了高速公路,闯入了公众视野。但对整个AI产业而言,技术突破只是解决了第一道障碍;除此之外,AI产业还有另一个长期困扰的难题。
突破:商业与价值
2020年初,著名工程与机器人设计公司波士顿动力正面临第三次“卖身”,买家将会是韩国现代汽车集团。短短8年时间,该公司已从谷歌、软银再到现代汽车“三易其主”,颇有种烫手山芋的既视感。
可单论技术实力,波士顿动力其实是业内标杆:收购前,光机器人相关的专利文献就有至少70篇,堪称美国国防部的亲儿子,从其手中获得了大量订单。波士顿动力曾替美军研发了运送物资用的LS3机器人、跳跃式军事侦察机器人Sand Flea,以及军用人形机器人ATLAS等等。
波士顿动力的机器人产品内,AI是“灵魂”所在:它能够使机器人保持“学习”,不断优化其运行效率。
AI虽能让各种多足机器人的脚法日渐出神入化,却没法让波士顿动力赚钱。2019年,波士顿动力发布了首款商用产品——工业用四足机器人Spot,希望能有工厂买单。可等到第二年业绩一出,外界发现该公司又净亏损了1.03亿美元,幅度还较往年扩大了六成。
波士顿动力过去的困境,也是AI产业的真实写照:空有一身功夫,却没有太多的用武之地。
一项技术只有从实验室走向商场货架,其社会、商业价值才能最大化。军事需求或许能带来短暂繁荣,但终归支撑不起一个行业,类似的故事曾在半导体产业上演过:消费电子时代的起点,向来不是五角大楼内的超级计算机,而是售价仅有19000日元的索尼TR-55晶体管收音机。
过去,AI产业能造的“收音机”仅停留在人脸识别等少数领域;但随着生成式AI大规模涌现,一个全新的超级应用场景正呼之欲出。
日常生活的一些角落,AIGC已悄悄发力。随便打开一个影视解说视频,大概率会听到一句“注意看,眼前的男人叫小帅”“眼前的女人叫小美”。这些格式整齐划一的流水线视频,正是AI配音的产物。
而眼下大火的AI绘画,也已被包括游戏在内的诸多内容行业所采纳。灵游坊CEO梁其伟曾在微博上提到,很多同行已经开始使用AI绘画,例如美术会将一些枯燥重复的图像处理工作交由AI,以提升工作效率。但在他看来,AI绘画的长期价值,在于加深了游戏创作的工业化程度。
如今一款电子游戏最大的成本,通常是美术——玩家对画面日渐挑剔是一大原因,但各种无效开销也居高不下。
因为游戏制作人并非都是美术出身,难免会出现需求表达不准确的时候,更何况每个人对美的理解也都不尽相同。这就导致美术天天加班连轴转,但最后交出去的成品,制作人怎么看怎么“不对味儿”,只能不断打回重画。
但随着AI绘画不断进步,未来游戏制作人可以更低成本地试错,甚至能大胆尝试一些截然不同的美术风格,这让很多积极创新的游戏公司深感如获至宝。
而在音乐领域,AI甚至成功弥补了音乐史上的一大遗憾。2021年底,贝多芬管弦乐团首次演奏了“完整版”的《第十交响曲》。这部曲子曾是贝多芬的遗作,他在生前只写完了第一乐章;AI在学习了它过往所有作品的数据后,续写了这部曲子。
至于前些日子方才走红的ChatGPT,已然有不少声音认为,它或将成为新一代搜索引擎。
毫无疑问,AIGC具有庞大的应用与商业潜力。只是它本身所具有的颠覆性,也引起了许多普通人的不安。事实上,人们对AI的不信任由来已久。
21世纪初,加州大学的音乐学教授David Cope曾做过一场实验:彼时,圣克鲁兹音乐节上演奏了一连串原创曲目,现场观众一度掌声雷动,心潮澎湃;可当他揭露出真相时,掌声瞬间变成了愤怒的谩骂。因为所有原创曲目均由是他设计的一款AI,模仿巴赫创作出来的。没有心灵的AI创作出的艺术品,怎么能和人类情感共鸣呢?
AIGC出圈后,社会舆论关注最多的议题,依旧是AI对艺术的颠覆性,却忽视了背后的潜力。
仅从当下的广泛应用已能够明显看出,AIGC明显能够辅助生产力更高质、高效地创作内容。从长期来看,AIGC或许能够极大地解放生产力和创造力,在内容创作以及更多领域掀起一场进化与变革。
抢滩:定义新时代
新时代幕布拉开前夜,准备抢滩登陆的大厂已早早开始了内卷。国内互联网企业向来以应用创新见长,迅速制作出了多款AI绘画应用。
但AIGC不同于过去的移动互联网,仅靠应用层面的竞争显然有些不太够。从该AI产业的历史能够能够明显看出,AI模型的迭代进步,才是AIGC爆发的直接原因。毫不夸张地说,谁掌握了更先进的AI模型,谁就拥有了开启新时代的钥匙。而在AI模型这一细分领域,实际也有中国企业的身影,而昆仑万维就是其中之一。
这家公司对国内用户来说或许略显陌生,但它在海外市场拥有相当可观的市场成绩。
昆仑万维旗下的招牌之一StarMaker,靠着“K歌+社交”的玩法,成为海外最大的在K歌类产品,拥有2.4亿名注册用户和2万名以上的认证歌手。该应用曾有一个衍生产品StarX MusicX Lab,正是昆仑万维的AI音乐模型,也是国内第一款商用级作曲AI模型。
如果仔细观察,会发现昆仑万维在AIGC的其他领域也有深入布局,其AI模型水准也不逊色于国外科技公司:
首先是图像领域:Stable Diffusion是当今AI绘画模型的天花板,但其适用的关键词仅限英文。而昆仑万维设计的分支模型不仅保留了原有功能,同时集合了海量中文数据,其收录的关键词甚至包括了古诗词。
除此之外,昆仑万维也在AI编程领域有所探索。这是全球第一款多语言开源编程大模型,每秒输出百字代码以上。
还有文字领域:实验室通过200张显卡训练了4周,打造出一个拥有百亿级参数的GPT-3生成AI,拥有续写,对话,中英翻译,内容风格生成,推理,诗词对联等功能。
对于一家公司来说,押注一个尚未成熟的新兴领域,既需要魄力,也需要技术储备,还得有多元化的业务作为生态支撑。AI模型是整个产业的基础,以此为地基才能催生出各种超级应用。结合昆仑万维的业务结构,这种基础设施也能和它已有业务产生奇妙的化学反应:
昆仑万维的Opera浏览器如今已是全球下载次数最多的独立浏览器,坐拥3亿多月活。在规划中,昆仑万维能够以此为中枢,将各式各样的新闻等内容产品提供给用户。
如果AIGC赛道继续保持增长,昆仑万维还有机会再拿到一张“供给”牌,因为AIGC供给的内容有无可替代的优势:相比于专业创作者生产的PGC,AIGC的效率更胜一筹;至于普通人创作的UGC内容,其内容质量和创作效率又很难和AIGC匹敌。
由此可见,AIGC能够带来高质、高量的内容供给,与Opera浏览器互相赋能,是一个典型的第二曲线增长路径。在如今消费电子需求萎靡,互联网增长见顶的环境下,一个能够落地的增长空间,既是行业需要的,也是资本市场苦苦寻觅的。
昆仑天工AI绘画作品
而且从眼下发展趋势来看,这个高速增长的未来并非“画大饼”,而是已然肉眼可见:
Gartner曾在一份报告中预测,2023年产出的内容产品中,约有20%会来自生成式AI;而到了2025年,生成式AI产生的数据将提升至整个互联网的10%。
而在某些具体领域中,变革将更加明显:如今AI生成的新闻初稿,已经接近人类记者写作30分钟的水准。科技公司Narrative Science的创始人大胆预测,到2030年时,9成以上的新闻写作将由AI辅助完成。
在《Generative AI: A Creative New World》这篇文章的最后,红杉认为今天的AI产业,与十年前智能手机刚刚兴起那会儿颇为相似:智能手机曾凭借GPS、相机和移动网络等新功能,催生了诸多超级应用并创造了全新的市场;如今,逐渐走向技术成熟的生成式AI,也会重演一遍智能手机的历史——定义下一个时代的竞赛已经开始了。
参考资料
[1] Generative AI: A Creative New World
[2] AIGC深度产业报告,量子位
[3] AI绘画何以突飞猛进? 从历史到技术突破, 一文读懂火爆的AI绘画发展史,Web3天空之城
[4] 未来简史,尤瓦尔-赫拉利
[5] 灵游坊CEO梁其伟:不用AI绘图,可能是老板太傲慢,游戏葡萄
[6] 2021年预测:人工智能对人类和社会的影响,Gartner
视觉设计:疏睿