8月底,在美国科罗拉多州博览会的一项艺术比赛中,参赛者Jason Allen凭借《太空歌剧院》获得了第一名,这幅作品是通过一款名为Midjourney的AI绘画工具生成的。[1]


尽管这个事情在艺术圈引发了很大的争议,比如有真人画家就愤怒质疑这是“高科技剽窃”,是在“逼死艺术”,但不得不承认,加上人工智能buff的绘画媒介正在迅速流行。在国内,6pen等AI绘画工具也逐渐受到很多人欢迎,正如6pen所介绍的那样,这类工具“基于AI技术,让文本描述变成绘画艺术作品”。


人工智能参与内容创作并不稀奇。早在2014年10月,全媒派就介绍过美联社同Automated Insights公司开展合作,通过名为Wordsmith的AI写作工具,将每季度上市公司发布的财报数据迅速转化成新闻报道。[2]


2016年,有新闻称,由AI程序和人类作家合作完成的短篇小说,在日本星新一文学奖中通过了首轮。[3]


2017年,微软公司推出的“小冰”,出版了第一部人工智能“创作”的诗集《阳光失了玻璃窗》。[4]今年年初,网易宣布推出AI音乐创作平台,10秒即可产出词曲编唱。[5]


从AI写作到AI编曲,再到AI绘画,用户只需要输入关键词,选择特定风格,就可以得到相应作品,人工智能似乎越来越“全能”,也越来越“懂”我们了,甚至开始涉及抽象的艺术领域。本期全媒派(ID:quanmeipai)以“媒介延伸论”为视角,聊一聊人工智能如何延伸人的思想意识,以及未来的媒介技术将会带来何种机遇与挑战。


Jason Allen的获奖作品


再谈“媒介是人的延伸”


1964年,加拿大媒介学家马歇尔·麦克卢汉在《理解媒介》中提出了经典的“媒介是人的延伸”,认为一切媒介(或者说技术)都是对人的某项官能的拓展和延伸。[6]


这一观点吸引了学界的目光,与“媒介即信息”、冷热媒介等观点一道备受追捧,同时也遭遇了批评。20世纪70年代后,麦克卢汉热潮短暂散退,但随着互联网的兴起和发展,它又再次焕发出新的理论光芒。


麦克卢汉把理解媒介锚定在“人的延伸”之上。如何去理解“人”,总是绕不开“灵与肉”这一重要主题。这也启发着学者们从身体和精神层面,去分析和透视麦克卢汉的媒介延伸论。



在身体层面,有学者以达尔文的“进化论”为视阈,首先将“延伸论”追溯到德国技术哲学家恩斯特·卡普于1877年提出的“器官投影论”,认为工具是人体器官在现实世界中的“影子存在”,但“延伸论”不再把媒介看作一种“投影”,而是人体生成的“新器官”,放大和强化了人体官能。


其次指出“延伸论”受到“进化论”间接影响,但弥补了其仅关注人类身体“器官进化”,忽视了“身体+工具”所构成的“体外进化”这一不足。因此认为,媒介是人的体外进化式的延伸。[7]


在精神层面,有学者发掘了麦克卢汉与弗洛伊德在精神分析学上的隐秘关联,认为弗洛伊德所言的作为“心理装置”的人体,会受到“媒介是人(的意识)的延伸”的影响和重塑。


麦克卢汉把媒介视为个体成为一台心理装置/精神机器,并由此实现集体互联和人类文明的转型的技术条件。这些“精神机器”之间是隔离还是联通、是机械还是共振,确定了麦克卢汉贬斥印刷技术、褒扬口语和电子文化的基本立场。[8]


总的来看,媒介带来的“人的延伸”,涉及身体的延伸和精神的延伸。汽车延伸人脚、衣服延伸皮肤,书籍延伸视觉、广播延伸听觉,电话“杂交”了声觉和听觉、电视“杂交”了听觉和视觉,技术意义上的延伸打破了身体感官的限制。


到了“从技术上模拟人类意识”这一“逼近人类延伸的最后阶段”,人的中枢神经系统在电子技术中得到了延伸。[9]


如今,我们似乎已然敲响了这一最后阶段的大门。


人工智能如何延伸人的思想意识?


在回答这个问题之前,我们需要去理解人工智能是一种什么样的媒介技术。


根据主流观点,人工智能(Artificial Intelligence,AI)作为计算机科学的分支,最早可追溯到艾伦·图灵的“图灵测试”,并由约翰·麦卡锡于1956年首次使用。此后60余年,人工智能经历了起步、反思、应用、低迷、稳步和蓬勃发展期。[10]


IBM深蓝超级计算机于1997年战胜了国际象棋世界冠军卡斯帕罗夫,谷歌推出的AlphaGo于2016年成为第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人,以上都是人工智能发展的标志性事件。


IBM指出,人工智能利用计算机和机器模仿人类思维的问题解决和决策制定能力[11],分为弱人工智能和强人工智能。


前者是目前人们接触最为广泛的应用,包括Apple的Siri、智能客服、自主驾驶,以及本文开头所讨论的AI绘画工具等。后者则存在于理论阶段,指具备自我意识的“智能人”。


以麦克卢汉的媒介观来看,人工智能本身是人的思维和智识的产物——媒介即讯息,其包含着研究人员花费大量精力去设计的架构模型和算法程序,蕴含着丰富的逻辑和智慧。



同时,作为一种应用、工具或媒介,人工智能是人的思想意识的延伸,是一种技术“外脑”。


此前的媒介技术,作为人的延伸,侧重于“使用”(use),调动的是感官和机能。


例如使用电话,让人们的声音传递到更远的朋友耳边;


使用相机,让人们所见的景象凝结成可以反复观看的照片;


使用电视,让过去或正在发生的事情传播到更多观众的眼前;


使用手机,让此刻想说的即时发送到对方的手机上;


它们均使身体的感官和机能得以倍增或深化,克服了物理局限。


以写作、绘画为应用的人工智能,则侧重于“生成”或“创造”(create)。人工智能通过机器学习大量文本素材,归纳出不同文本的特征并分析出文本之间的联系,这成为创造的基础。


到了应用阶段,用户使用文字描述出内容,人工智能则通过语义分析去判断和生成作品,仿佛在完成一次次“读心术”。


具体到本文所讨论的AI绘画工具,以6pen为例,其“模型本身采用大量图片素材作为机器学习的样本”,并要求用户“描述清晰明确,包含画面中出现的物体和他们的信息,避免和画面无关的词”,还提示用户“合理和巧妙的使用各种关键词”,包括风格修饰、画面类型等。[12]


AI绘画工具辅助人们将抽象的思想意识生成为具体的艺术作品,这一过程离不开人的参与。人们仿佛扮演了“上帝”的角色——“要有光,于是就有了光。”


AI绘画技术面临的机遇与挑战


“技术”(technology)一词来自希腊语techne,和“艺术”共享同一词根,这揭示了技术和艺术之间紧密的联系。


正如本文开头提到的,人工智能作品在艺术比赛中获奖,这既是思想意识在媒介中的延伸,是人和机器、技术和艺术之间融合共创的显影,也是人工智能参与艺术创作这一发展趋势的开端。


在国家战略层面,《新一代人工智能发展规划》《“互联网”+人工智能三年行动实施方案》《智能制造2025》等政策文件,都昭示出人工智能对经济社会发展的重大意义。未来,人工智能的成果将会应用到社会经济生活的各个方面。


那么,以AI绘画工具为代表的媒介实践又会带来何种机遇与挑战呢?


首先,AI绘画技术延伸了人的思想意识,但在情感和灵韵方面仍有所欠缺。


目前的AI绘画工具在文本描述时,往往要求创作者使用更为准确、具象的词句。但是,艺术却来源于灵感、情绪或“缪斯”等无以名状的时刻。


对比之下,AI绘画作品的工具性和功能性较为突出,但在情绪或情感的呈现上会容易显得空洞,缺少灵韵。


正如彼得斯所言,“对于人,机器难以模仿的正是人的脆弱之处,而不是人的理性之处。”[13]未来,AI绘画工具也许会广泛应用在重复性制图上,但在艺术创作上,如何捕捉“形容词”,去理解人的情绪和情感,则需要进一步迭代升级。



其次,AI绘画作品的创作者到底是谁?


是AI绘画工具本身,还是使用AI绘画工具的用户,抑或是提供AI绘画服务的平台呢?对此,不同的平台对版权归属有着不同的界定。


文首获奖作品所使用的AI绘画工具Midjourney,付费用户享有全部版权,非付费用户享有版权但禁止商业用途,此外还针对企业用户提出了版权要求。


国内的AI绘画工具6pen则明确指出:“图片版权,完全授权给生成者本人。”另一款AI绘画工具Stable Diffusion生成的艺术作品,版权不归属于个人,也不归属平台,所有人都可以在商业和非商业场景中使用。


同时,因为AI绘画工作借助大量素材进行深度学习,生成的绘画作品往往会有着似曾相识的感觉,也容易发生抄袭等附加问题。


因此,AI绘画服务平台往往会建议用户“使用已经去世的画家作为风格修饰”。但这似乎只是在回避而非解决问题本身。


最后,AI绘画技术不断升级,但仍然依赖人的创造力和表达力。


AI绘画是一种人机交互的数字艺术。过去的绘画,如同西班牙画家毕加索反复临摹鸡蛋那样,需要创作者不断学习和练习,以培养扎实的绘画能力和高级的美学情趣。


AI绘画则将“原子转化为比特”,创作者不再需要动手握笔,而只是敲打键盘、点击鼠标,创作过程变得更为简单。


但是,过程简单不意味着创作变得简单。针对同一景象,不同人的描述可长可短、可精确可模糊,最终生成的作品也必然会有差别。


如何让人的思想意识完整地延伸到人工智能之中,让AI绘画工具更好地理解人的想法,这涉及到人与机器的交流互动。


因此,AI绘画技术虽然会不断升级,但依然离不开创作者自己的想象和表达。也许,未来的AI绘画艺术,也会是一种关于表达的艺术,它延伸了人的思维,却又依赖于人的思维。