AI的跃进式发展,正让制作视频变得越来越简单。不管是今年上线的众多软件工具,还是网上爆火的各种AI生成视频,都给人一种用AI分分钟可以制作电影的感觉。

那么,当下AI生成视频到底发展到哪个阶段,普通人又能用哪些AI工具制作视频呢?

摩登AI从各类新闻、网络博主的推荐中,挑选出3款较为常见的文字生成视频工具,进行了实际体验。这三款软件分别是剪映、Fliki、以及Pictory。

作者 | 三余

编辑 | 聂风

剪映

剪映在2021年推出了“图文成片”功能。使用这一功能,只要输入文案,软件就能智能匹配图片素材、添加字幕、旁白和音乐,自动生成视频。

首先,我们以“为什么说福尔摩斯是世界上最伟大的侦探”为主题,让GPT生成一段文案。AI很快生成文字如下:

接下来打开剪映专业版,点击图文成片功能,输入文案,选择音色,点击生成视频,生成的视频如下图所示。

点击查看预览可以发现,大部分画面都与文字内容相符。这时候可以选择继续优化编辑,替换掉不合适的图片,增加封面,或者添加一些特效。为直接呈现文字生成图片的能力,这里我们不对素材内容做修改,只是将全片语速调到1.2倍,然后直接生成视频。最终视频效果如下:

浏览整个视频可以发现,整体质量尚可,但默认字幕形式较为单一,因为没有替换视频素材,整个视频完全由不断切换的图片构成,显得有些单调。

如果需要在短时间内制作大量短视频,又不过于追求视频质量的话,利用GPT或者国内的文心一言、星火大模型等,都能快速生成不错的视频文案,然后配合剪映的文字生成图片功能,剪映是可以满足创作者的基本需求的。

Fliki

Fliki主打文本转视频和文本转语音。它可以根据用户添加的博客文章地址,用AI总结内容,匹配画面并生成画外音视频。Fliki支持75种语言的850种声音,包括汉语,甚至还提供了上传语音功能。

进入网页,选择创建新项目,语言为中文,同样使用之前的福尔摩斯文案。

在左侧文本框内输入文案,系统会自动对文字进行切分,并根据内容匹配素材库内的资源。如果无法确定该配上什么样的画面,会暂时显示空缺,可以点击手动匹配或修改。这里我们随便从素材库中选择一张图片,填补画面空白。

和剪映类似,Fliki生成的视频内容同样可以进一步编辑。我们同样不做进一步修改,直接选择生成视频。最终成片效果如下:

通过与剪映的成片对比,可以发现视频图文不符的现象较为严重,如果说剪映成片中还有着烟斗、福尔摩斯电影海报之类与福尔摩斯相关画面的话,Fliki成片中则仅有少数私家侦探望远镜的画面,反映出视频主题。整个视频甚至很难看出与福尔摩斯的相关性。

唯一的优势是,Fliki支持的声音选项更多,且在视频生成过程中会自动匹配画面,成片效果比剪映更生动一些。另外,从画面色彩上看,Fliki生成的视频色调比剪映要明亮许多,两者风格差异明显。考虑到这是一款英文软件,这些并不难理解。

对创作者来说,如果觉得剪映一款软件的素材库过于单调,或许可以两款软件组合使用。不过需要注意的是,Fliki需要付费使用,且只支持国外信用卡。

Pictory

Pictory位于美国西雅图,主打文本生成视频功能,但也可以“精炼”长视频,就是自动提取长视频内容中适合传播的内容,比如演讲金句、观点之类。

从Pictory的宣传页面来看,精炼长视频并非它的主打功能。点击第三项进入,可以看到可以选择上传视频或者输入视频链接选项,目前该软件只支持油管视频链接,语言方面支持英法日韩等多种语言,暂时不包含中文。

这里我选择的是乔帮主2005年在斯坦福大学毕业典礼上的演讲链接,视频全长15分钟左右。网站提供了从5%到75%的精炼百分比,不同百分比对应生成视频的不同时长。

选择最小的5%,最终生成的精炼后视频长度在1分30秒左右。

对比演讲原文,发现内容过于精简,演讲的主体内容已经不复存在,但从摘录金句传播的角度讲,还是符合需求的。这个功能特别适合快速生成会议短视频。

另外,软件同样支持二次编辑功能,可以对精炼后的视频画面进行剪辑,替换,或者添加、调整字幕。

小结

用传统方式创作视频,往往需要经过撰写脚本/文案,拍摄视频或寻找第三方素材,剪辑,配音,配乐,添加转场、特效、字幕、标题、封面图等众多环节。通过体验不难发现,文字生成视频类的AI,已经可以快速完成其中的大部分环节。如果配合多种软件的组合应用,配合后期人工微调等方式,可以大大简化原有的视频制作流程。

但这样的效果,离普通人想象的只要说出一段文字,AI就能自动生成完全符合心意视频的功能还有很远。

这类产品的最新产品中,Meta发布的视频生成工具Make-a-Video,目前还在内测,页面只有研究论文可供查看。Stable Diffusion推出的Stable Diffusion Videos提供下载,但是对硬件要求更高,需要至少40G显存的GPU,离一般用户过于遥远。

Adobe的AI图像生成模型套件Adobe Firefly(萤火虫),官方演示效果惊艳。Firefly 仍处于 Beta 阶段。目前获得访问权限的唯一方法是去官网申请排队。据说这个时间可能长达一个月。

如果确实想体验AI生成视频最先进的结果,可以去体验阿里达摩院今年3月,上线的“文本生成视频大模型”。只要输入文本,便能生成2-4秒左右的视频片段。此前流传的威尔史密斯吃面条视频,便是用这个模型制作的。该模型目前只支持英文输入,以下是摩登AI的实验结果。Prompt为a panda eating bamboo on a chair。

另外,Runaway 推出的GEN-2目前并未上线,官网只开放了GEN-1体验功能,免费试用可以创建3个视频,每个时长限制4秒,付费后生成长度可以提高到15秒。

综合来看,目前AI生成视频的效果并未太过超出人们想象。对个人up主或者一些中小企业来说,目前可以利用AI批量生成短视频,达到冲量的效果,以数量换取爆款可能;或者用来生成教育、产品介绍、培训或者营销类的视频;或者可以利用软件提供的使用功能,创建一些体验类视频,向公众展示AI生成视频的现状。

不久前,《复仇者联盟》导演乔·罗素接受《Variety》杂志采访时表示,AI不会消失,所有人都应该害怕AI。

他预计,2年后就有望出现一部完全由AI制作的电影。比如,如果你想要一部自己和玛丽莲梦露主演的爱情喜剧,只要对AI说出需求,就能拥有一部专属于你的电影。

这一天或许很快就会来到了。