人工智能势不可挡。
本周,包括微软、谷歌、英伟达、Adobe在内的全球多家科技巨头公司都不约而同地发布或开放生成式AI新技术,其中微软和Adobe发布了与图像生成相关的新应用。
然而,AI不仅可以帮助人类,也会被利用来戏弄人类。
例如,近日互联网上流传着美国前总统特朗普被捕的照片,实际上这些照片都是由人工智能生成,并不是真实发生的事件。
3月18日,特朗普曾在社交媒体上表示,他将在当地时间21日被逮捕,并多次呼吁支持者举行大规模抗议。但是由于法律程序问题,特朗普并未如期“被捕”,但从当天开始,互联网上就出现了各种使用人工智能合成的特朗普被捕画面,“以假乱真”。
微软、Adobe推出AI画笔
以ChatGPT为代表的“高智商”AI,正在掀起新一轮的AI革新。英伟达创始人CEO黄仁勋将这一轮技术革新称为“AI的iPhone时刻”。他认为,AI可以帮助人类创建初稿、建立初步的设计,帮助人类打开“脑洞”,激发人类的创造力,提升生产效率。
谷歌当地时间21日也正式在英国和美国开放对其AI聊天机器人Bard的访问权限,用户可以加入等候名单以访问Bard。Bard称将能帮助用户概述和撰写论文草稿,以及根据冰箱里的食材制作创意午餐等。
谷歌、微软、脸书母公司Meta和其他科技公司正在竞相开发和部署人工智能工具。上周,在谷歌宣布将人工智能引入包括Gmail、表格和文档等生产工具之后,微软也加强了人工智能辅助搜索功能,并宣布将其生成式人工智能技术添加到办公自动化应用程序中,包括Word、PowerPoint和Excel。
微软21日发布的最新工具命名为“Bing Image Creator”,将允许必应(Bing)和Microsoft Edge浏览器的用户使用OpenAI的DALL-E创建文本提示图像,用户可以通过语言文字生成图像,例如要求画一张“宇航员穿过向日葵星系”的图片。
微软的这一新功能将以预览版的形式提供给用户。微软表示,将首先在Bing搜索引擎的“创意模式”中推出,并最终完全集成到Bing的聊天体验中;在MicrosoftEdge上,图像生成器将在浏览器的搜索栏中可用。
另一家最新进军生成式AI领域的科技公司是Adobe。同样在21日,该公司推出了一个名为Firefly(“萤火虫”)的应用,专注于创建图像和文本效果,用户可以通过输入命令快速修改图像,该应用将被整合至现有的产品套件中。
在一个示例中,Adobe展示了如何将一张夏日场景的照片更改为冬日场景,用户只需要输入“将场景更改为冬日”,无需进行任何编辑就可以将图片完成更改。
去年Adobe斥资200亿美元收购了设计工具Figma,未来将会向更广泛的AI进行转型。
上周,百度在发布类ChatGPT的AI聊天机器人文心一言时,现场演示了AI作画功能,不过此后网友测试文心一言的图像生成功能后发现AI对于一些特定名词的理解还不准确,这导致千奇百怪的图片在网上广泛流传。
所有画师都会被AI替代?
但AI的能力已经让人类惊叹。最近有一张情侣照在网上引起了轩然大波。一对穿着90年代服装的年轻人坐在屋顶上,背景是北京的老旧楼房,这张看起来与真人没有任何差异的图片,竟然是由AI一键生成!让网友大呼“人类画师要失业”了。
这张图片在网上迅速走红后,背后的AI绘画工具Midjourney V5也引起巨大关注。该软件不仅可以生成现代风格的图像,还可以模拟不同年代和地域的场景。比如,“一个穿着汉服、手持扇子、坐在亭子里看书的女子”,或者“一个穿着牛仔裤、背着吉他、走在纽约街头的男孩”;它还可以根据用户指定的风格参数来调整图像效果。
“我们觉得结合语言的生成模型代替的是传统的各类资产库,就好像大语言模型(LLM)之于搜索引擎、文本转图片(texttoimage)之于‘视觉中国’。”影眸科技首席技术官张启煊对第一财经记者表示,“ChatGPT已经把搜索搅了个底朝天,Stable Diffusion之类的技术也在冲击传统图库;接下来就是3D资产库,从传统的关键词匹配的‘搜索’,转换为‘生成’。”
Stable Diffusion和OpenAI的DALL-E一样,都提供生成式AI图像产品,Midjourney就是基于Diffusion技术。
张启煊表示,他们正在进行文本转3D的下一代技术研发,现在已经可以实现直接将文本生成3D数字人资产,预计于本月底上线,可以用于影视游戏当中。
他认为,尽管最近一波生成式AI的发展都具有颠覆性,但Adobe这类工具仍然有存在的必要性,因为纯文本的隐式控制的可控性不足;但是需要结合生成模型进行革新。
资深游戏行业人士、丰厚资本创始合伙人谭群钊对第一财经记者表示:“产业正在发生剧变。我们认为生成式AI的出现一定会全面改变创意文化产业,美术制作的工具链、工作流程、人员配置都会发生变化。我们投资的公司也在研发AI作画的平台。”
不过谭群钊认为,虽然生成式AI将极大地提升作画的效率,但是并不意味着未来所有的画师都会被AI替代。“首先需要高级的画师做出更有风格的作品,其次是需要普通画师去使用AI工具,得到更实用的作品。”他对第一财经记者表示,“甚至还需要初级画师去修改AI作品,让它看起来更接近于人的作品。”
欧盟AI立法难度陡增
和ChatGPT一样,生成式AI图像背后也一直存在伦理方面的隐忧,这些担忧涉及模型倾向于“产生幻觉”的看似合理但不准确的信息;此外,人们还担心大模型会窃取艺术家内容、重新生成并在未经创作者授权或许可的情况下进行展示。
生成式AI的突然火爆也令欧盟正在草拟的人工智能法案难度陡增。虽然行业预计年底前欧盟有望就人工智能法案达成协议,但有人担心该立法可能因其复杂性和意见不统一延迟到明年推出。
据透露,为了解决像ChatGPT这样无穷无尽的应用程序的监管问题,预计欧盟立法者将会引入一个新的类别,即“通用人工智能系统”(GPAIS),以描述可以适应执行多种功能的AI工具。但目前尚不清楚是否所有的GPAIS工具都将被视为“高风险”。
技术的发展与监管始终是一对矛盾体,欧盟立法讨论也引起了从小型初创公司到大型科技公司的担忧。他们认为,监管在立法的同时也应避免对技术发展的束缚。行业机构appliedAI最近的一项调查显示,51%的受访者预计人工智能法案一旦推出,将导致AI开发活动放缓。
音频流媒体平台Spotify(声田)的首席执行官丹尼尔·艾克(DanielEk)认为,生成式AI的技术是一把双刃剑。Spotify最近推出了自己的AIDJ,能够管理个性化音乐播放列表。“我们必须考虑很多事情。”艾克说道,“我们的团队正在与监管机构积极合作,努力确保这项技术尽可能多地受益,并尽可能安全。”
在中国,今年1月10日起,首次针对深度合成技术的监管规定——《互联网信息服务深度合成管理规定》已正式实施。清华大学国强教授、智能产业研究院首席研究员聂再清对第一财经记者表示:“如果相关法规针对生成式AI在文字内容生成方面没有明确的规定,那么随着ChatGPT这类技术的应用更加广泛,未来可能需要重新审视在包括文章、论文、广告等生成内容方面的审核。”
小米前副总裁、安全与隐私委员会主席崔宝秋也对第一财经记者表示:“技术监管是一场永恒的攻防对抗博弈。深度合成技术的服务方在提供服务的同时,会产生多方面的风险,除了深度伪造的风险外,还包括自动生成内容文本、图像或者视频带来的版权和著作权的侵权风险,信息安全和隐私泄露风险以及敏感内容的风险。”
崔宝秋建议,未来出台的相关法规中,应该强制要求服务提供方对于哪些内容是深度合成的进行标注;对于技术提供方而言,则应从底层技术开始推进相关标准的建立,在算法上保证计算模型的公平性。