你好啊,AIGC时代


2022年9月6日,美国科罗拉多州的艺术博览会上,一幅名为《太空歌剧院》的画作,在数字艺术类别中一举夺冠。令艺术界大为震撼的是,这幅作品全程由AI制图工具生成,再经Photoshop润色而来。


2022年12月,一家叫QuickVid的网站,又让短视频行业响起阵阵警铃。用户只需在QucikVid输入提示语,描述视频主题,AI就能自动生成兼具图片、配音、背景乐的短视频。


尽管自AI诞生的那一刻开始,“机器取代人类”的争论就持续蔓延着。但我们从未遇到过当前的危机时刻:从AI绘画到AI视频,人类在创造类的领地也走向了失守。


随后,AI界的王炸——ChatGPT横空出世,并快速完成GPT-4的升级迭代。它能写论文、写代码、写小说,和人类无缝聊天;在诸多资格考试中,获得比普通人更高乃至满分的成绩;以管理者的身份,给出消除社会不平等的切实举措;它还相当具有道德标准,对“如何制造炸药”的危险提问,表示拒绝作答。


风浪一波未平一波又起。ChatGPT在今天宣布开放插件系统,实现联网功能,并与超5000个应用交互。这意味着“GPT-4只能查询21年的数据”成为历史,而用户可以利用GPT点餐、购物、订机票等等。


OpenAI的研究论文指出,对于大约80%的美国人来说,至少有10%的工作任务会受到GPT的影响。在大约19%的岗位中,有50%的任务会在某种程度上被AI自动化。


不过短短几个月时间,几乎各行各业或主动或被动地大声喊道,你好啊,AIGC时代。


这些翻天覆地的改变背后,AI产业到底经历了什么关键突破?我们如何审视AIGC带来的变化与商业可能性?



GPT-4爆火背后:AIGC的底层逻辑


随着ChatGPT、GPT-4的爆火,人们纷纷将目光投向了AIGC(AI Generated Content)行业。


跟紧OpenAI的步伐,百度推出文心一言,微软宣布将GPT-4、DALL-E等,整合进其旗下Bing搜索引擎、office办公套件、Teams聊天产品中。Adobe推出生成式AI Firefly,旨在帮助用户生成图像和艺术文字。就在23日,谷歌也开放了聊天式机器人Bard。


一切变化快得超出想象,且不可思议:从现在开始,人们不用学习原理,不需要专业工具,只要用语言提出需求,就可以得到相应的文字、图像、视频、3D等成果。


但AIGC行业的爆发式繁荣背后,却是算力、算法、数据三大底层能力,长达十年的蛰伏。


这一次,以ChatGPT为代表的AIGC之所以有突飞猛进的发展,最关键的因素就是算法的迭代。


2014年,AIGC的第一代算法——生成式对抗网络GAN诞生。典型的GAN包含两部分,即生成模型(Generative Model)与判别模型(Discriminative Model)。


沿用学者王圣元的观点,生成模型与判别模型的关系,就像造假者与鉴定者。造假者不断造出假货,目的就是蒙骗鉴定者,在此过程中其造假能力越来越高。鉴定者不断检验假货,目的就是识破造假者,在此过程中其鉴定能力越来越高。


GAN 是造假者,也是鉴定者,其最终目标就是训练出一个“完美”的造假者——该模型生成的作品通过著名的图灵测试,意味着AI也具备人类的智能。


紧接着,AIGC的算法更进一步。包括全新发明的深度学习模型CLIP、Transformers神经网络架构。相对于GAN,CLIP模型能够将文本与图像进行关联,Transformer则擅长理解自然语言,两者共同构成GPT的基础。


第三代Diffusion扩散化模型出现的时间可以追溯到2020年,直至2022年已经扩展到语音、视频、点云数据等多个领域。通过学习如何为图片去噪,Diffusion模型所需训练数据更少,精度更高,甚至在长期积累中更具“艺术模仿与创造”的能力。


随着自然语言处理与扩散模型的发展,AIGC的走向必然是极高接近性与极高创造力。也难怪英伟达CEO黄仁勋四度使用“iPhone时刻”,来形容AI当下的发展。



内卷的大模型 赢麻的英伟达


可以说,有了算法层面的突破,微软、谷歌、百度才得以开展大模型的军备竞赛。但对整个AIGC上游产业而言,GPU算力技术也尤为关键。它的作用堪比“军火”,更早决定了AI的决胜时刻。


什么是GPU?1999年,伴随着图像、游戏的发展,图形处理的需求增多,英伟达提出GPU概念,即开发出一种计算机组件,专门用于提升计算机游戏和图形应用程序的性能。由于其强大的算力,GPU正被广泛应用于深度学习、人工智能等领域中。


回望GPU三巨头(英伟达、AMD、英特尔)的发展历程,也会发现有意思的地方:它们在资本市场受追捧的程度,与其对应GPU产品的算力提升速度几乎一致。


如今,因为十年前在AI领域的大胆押注,以及对OpenAI的“慧眼赏识”,英伟达已经遥遥领先竞争对手。


当我们回到2016年8月,距离OpenAI成立仅仅过去八个月的时间。英伟达便在100多家公司的订单面前,率先向OpenAI捐出了全球第一台 AI 超级计算机DGX-1。


英伟达CEO黄仁勋写下:致 Elon 和 OpenAI 团队!为了计算和人类的未来,我捐出世界上第一台 DGX-1!OpenAI 团队表示,借助DGX-1的超强GPU算力,以往花费一年才能跑完的数据量,现在只需要一个月。


3月23日,在GTC开发者大会上,黄仁勋再次提及与OpenAI的往事:


“我亲手将全球首款DGX交给了OpenAI。自此之后,《财富》100强企业中有一半安装了DGX AI超级计算机。”


“DGX超级计算机是现代AI工厂,我们正处于AI的iPhone时刻。”


与此同时,专为AI推出的GPU平台顺势发布,包括适用于AI视频加速的L4,适用于图像生成加速的L40,适用于扩展LLM(大型语言模型)推理的H100 PCIE,适用于推荐系统和向量数据库的Grace-Hopper。


除了以高性能GPU加速AI计算,英伟达还将其作为一种云服务,提供给企业和开发者,帮助他们快速、轻松、低成本地构建和部署自己的AI模型和应用。


这不仅意味着,在GPU的算力加速下,AIGC的速度更快、内容精准度更高,还预示由AI直接生成3D内容、蛋白质和化学物质都将成为可能,制造大模型的能力也有望从微软、谷歌等头部玩家转向中小入局者。



AIGC时代的就业秘笈


“我们相信,人工智能会彻底改变我们今天的每一个行业。AI的长期价值,对各行各业的颠覆性改变,才刚刚开始。未来,将会有更多的杀手级应用、现象级产品出现,将会有更多的里程碑事件发生。”


正如李彦宏在“文心一言”发布会所说,AIGC带来的时代变革显而易见。比起讨论AI能够淘汰掉什么行业,我们或许应该更关注,AI可以创造哪些工作?


GPT给我的答案是数据分析师、机器学习工程师、软件工程师、人工智能产品经理、数据科学家、自然语言处理工程师等等。



但答案肯定不止于此。根据量子位在《AIGC深度产业报告》的梳理,AIGC产业涉及上游(数据供给方、开源算法社区、创造者生态层等)——中游(文字、图像、音频、视频等垂直赛道)——下游(应用场景和终端客户)。


在聚焦上游的算法与算力变革后,我们在具体的中小游应用方面,也找到相应案例:


  • AIGC+新闻


AIGC进攻新闻界也不是什么新鲜事。早在2015年,由腾讯、百度推出的新闻写作机器人,曾亮相报道;类似小爱同学、天猫精灵的AI音响,也一度掀起过国内资本热潮。


冰山的另一面在本次AIGC风潮中展露。ChatGPT及GPT-4接入必应搜索后,以往的资料检索,由两三天、一周缩短至几个小时;图片、视频制作,由类似Adobe、QuickVid的工具生成;在传播环节,国内世优科技将接入文心一言模型,并进一步推出AI虚拟主播。


  • AIGC+绘画


AI作画也正在成为趋势之一。2022年9月,OpenAI就推出了DALL-E 2绘画网站。即使用户毫无任何艺术细胞,只需输出描述文字,便能一键生成图片。据国泰君安研报显示,未来 5 年,AI 绘画在图像内容生成领域的渗透率将达到 10%-30%,形成超 600 亿元规模的新兴市场。

  • AIGC+广告


最近,可口可乐用 AI 做了一次广告。利用 AI(Stable Diffusion)+3D+实拍的形式 ,发布最新的创意广告短片后,可口可乐鼓励艺术家们通过AI技术,引用其视觉标志进行二次创作。


与此同时,选择all in元宇宙的Meta,推出了一项叫做Advantage+的自动生成广告系统。Advantage+能够根据营销目标自动生成AI广告,旨在“让品牌节省吸引特定用户的时间,而更专注于创意策略”。


  • AIGC+游戏


如果说AI新闻、AI绘画、AI广告还仅仅处于“蓄势待发”的展望阶段,那游戏行业对AIGC的拥抱,已经处于“进行时”。


比如,在招聘软件上随手搜索游戏行业,常规美术师的招聘岗位大幅下降;另一边,AIGC方向的游戏美术、游戏制作、产品经理持续增多。


AI生成剧本、人物、动画、特效、3D模型,甚至游戏主程序,将大幅减少游戏开发的成本与时间。招商证券显示,ChatGPT科技浪潮下,游戏行业有望是最终的受益者,自动生成人物和场景等有望出现,游戏行业千人千面将成为可能。




未来已来,将至未至


我们总是以为变化会突然降临,但其实所有的变化都酝酿已久。


就好像此刻,与AIGC相关的新消息在近两周持续“轰炸”,既让人兴奋不已,又有些措手不及。但OpenAI的成立时间在六年以前,GPT-4的技术迭代也早于去年完成;若从第一代AI模型诞生开始,AIGC的伏笔已经埋下近十年。


GPT-4无疑是AIGC最成功的代表作,但它并非完美无瑕。底层数据有待核查,创造力尚未到理想程度,甚至在接入时也颇为费财、费力。


更重要的是,GPT-4打开了我们对于未来的想象空间:就像工业时代的到来,没有让马车跑得更快,而为设计汽船、火车、飞机提供新的可能性;AIGC时代,是人类大脑的延伸,必将催生新的产业结构样态与商业组织形式。


希望百年后,我们将会回顾这一刻,并说:那是真正的新时代的开始。


<end>