3月16日,Midjourney V5正式发布,逼真性、细节性震动业内外,网友们玩儿的不亦乐乎,设计师Adam fard在Twitter留下一道“无奖竞猜”:下面四张图,只有一张是真人,其它都是Midjourney 画的,你能猜出是哪张吗?
人类的肉眼凡胎已经无法抵御AI的魔法攻击,广大网友们摆烂式回复“稍等,我先预约下眼科”“Midjourney顺便帮我生成一双眼睛吧”...
而国内下一代人工智能安全企业中科睿鉴率先公布了答案——只有小女孩是真人!古语有云,打败魔法还得是魔法本身,反制AI还得靠AI。经Adam fard本人确认,中科睿鉴喜提“标答”。
(图像生成内容检测工具“睿图”针对Midjourney生成内容检测结果)
不仅图像,在Chatgpt 4发布一周内,睿鉴团队迅速上线了针对Chatgpt 4生成文本内容的检测工具“睿鉴图灵”。事实上,睿鉴已经完成面向文本、图像、音视频伪造检测全技术栈技术布局。
(文本生成内容检测工具“睿鉴图灵”针对Chatgpt 4检测结果)
(音视频生成内容检测工具“睿安”针对各类型深度伪造数据检测结果)
之所以具备如此高效的模型演化迭代效率,得益于睿鉴打造的伪造检测行业基础大模型。历经三年,面向公共安全、金融安全、互联网内容安全等重点行业,睿鉴逐步积累了分行业、分场景的伪造检测能力,形成了核心技术——AI基础设施——行业基础大模型的体系化能力底座,参数量级达到60亿。因此,新的伪造生成技术一经面世,通过微调,就可在基座模型基础上针对性地迅速分化出相应的检测模型。
(行业基础大模型框架)
数据的生成与检测互为对抗,也互相促进。如何精确、高效地“喂饱”模型、“喂好”模型,是让模型“成长为专家”的另一个关键。睿鉴将数据生成的过程进行集成,研发了一个全自动化的数字内容生成平台。内置百余种深度合成、diffusion类生成算法可快速调用,支持多人、多目标、复杂场景下的高逼真生成。
(睿鉴数字内容生成一站式平台)
此次针对MidJourney V5的对抗式AIGC内容检测模型训练框架,在历时数月的训练数据准备阶段,基于三年形成的多模态生成模型底座复现了十余种diffusion模型,最终生成了TB级的高质量生成数据。结合在多领域应用场景中积累的人工数据,输入包含多种检测算法的多模态检测模型底座,产生的内容检测模型可以即插式快速加入检测模型族。针对新型伪造算法,可以快速生成、快速调优训练,快速部署应用,大大缩短整体流程。
在模型训练时,我们采用fp64高精度模型,以模型判断、传统图像处理、多模态逻辑判断相结合的方式突破传统方法局限,训练任务以多模型、多模态方式进行,模型间损失函数误差每隔特定迭代次数同步一次,并随时调整相关模型的学习率,在海量参数模型基础上进行多个鉴伪模型分布式联合训练,以使模型检测实现最高效率与最佳效果,当前整体使用的训练算力,相当于100张英伟达A100训练3个月。
据悉,中科睿鉴长期深耕虚假伪造检测技术的研发,核心成员来自中科院计算所数字内容合成与伪造检测实验室,是伪造检测领域的“国家队”,未来,中科睿鉴将通过算法突破、产品创新、系统搭建实现更多“必杀技”,织密筑牢全栈式伪造检测防线,打造新时代互联网数字内容安全基础设施,用技术让世界更可信。