这是一条在抖音收获了207万点赞,8.6万条评论的视频。

视频的主角是一只胖墩墩的英短蓝猫。

起初,蓝猫看起来并没有什么特别。然而,经过一番AI运算,蓝猫出人意料地“变身”成了一个动漫风女孩。娇小的体形、蓝色的耳朵和尾巴提示网友,她就是刚刚那只猫的拟人版。


“AI漫画”,让万物皆可“变身”

实现这一“变身”的,是2022年抖音上最火的一款特效玩法——“AI漫画”(原名AI绘画)。只要输入一张图片,AI就会根据图片生成一张动漫风格的图片。截至目前,这款特效已经有超3000万人使用。

有网友称,“万物皆可变漫画,这个特效太厉害了”。

他们热烈参与,看看AI会对自己的照片做什么。

你可能不知道的是,这款火遍抖音的特效,从启动到上线只用了一周多时间。

这离不开火山引擎机器学习平台的支持。


抖音爆款特效,如何用好机器学习

当前,包括“AI漫画”在内的各类AIGC应用掀起智能化浪潮。作为AIGC的底层算法之一,国内很多科技公司都投入到大模型建设中。这对算力资源提出了迫切要求。火山引擎要做的,就是为大模型客户提供高稳定性和高性价比的AI基础设施。

在火山引擎机器学习平台上,数据处理的整个过程、模型训练、评估到上线,再到AB测试,都有统一的集成,能实现资源的高利用率和极低成本。

举个抖音推荐系统的例子,算法工程师用15个月的样本训练某个模型,5小时就完成了训练,成本只有5000元。

具体到“AI漫画”这个案例。2022年8月底,Stability AI公司将自己的AI文本-图像生成模型Stable Diffusion开源,技术团队在开源模型的基础上,训练出了动漫风等多个模型。

当时,算法工程师在平台上写了一些调研的代码,大概用了一个星期就完成了模型的训练,经过一些调教之后就发布到线上了。

除了模型训练外, 高并发的推理服务也有大量的机器资源开销。

和传统的生成模型GAN相比,Stable Diffusion的多样性和风格化更强,变化形式也更丰富。

然而,Stable Diffusion的模型体积和计算量远远大于GAN。上线到抖音这样一个亿级DAU的平台,GPU推理成本可想而知。

在火山引擎机器学习平台的支持下,“AI漫画”的推理效率,比原生的Pytorch模型快5倍。特效上线之后,技术团队又做了一些针对性的优化,让推理速度变得更快,大概快了10倍。

当业务忙碌、新用户在短时间内大量涌入时,技术团队还通过机器学习平台自动化调配公司内部的其他闲置计算资源,避免了服务器崩溃。

在上线前,“AI漫画”的预计峰值为200QPS,实际上线之后,达到了1.4万QPS。上线后的首个周六上午,火山引擎机器学习平台能支持2000QPS,很快,就达到了能支持2万QPS的水平。

争取做AI大模型“发动机”

最近,在2023春季火山引擎FORCE原动力大会上,火山引擎推出了新版机器学习平台,以支持企业客户更好地训练AI大模型。经过抖音等业务的长期打磨,现在,新平台能支持单任务万卡级别的超大规模分布式并行训练场景,最高可以为客户节省70%的算力成本。

会上,火山引擎还宣布与字节跳动国内业务并池。基于内外统一的云原生基础架构,以后,抖音等业务的空闲计算资源也可极速调度给火山引擎客户使用。

未来,大模型会在各个行业内不断兴起。火山引擎希望用技术服务更多客户,共同推动各行业的智能化升级。