在网络上,没人知道你是人是狗,以前和你激情对线都是真人,现在可能连人都不是了!
大家平常在网上都能看到各类话题下,各类网友在评论区激情互喷,不管什么话题都有人来跟你认真计较一番,更多的时候大家都不愿意去了解事情的原委,更喜欢结合自己的主观判断输出自己的情绪之后,就扬长而去。
上面那种人还好,不理他们就是了。还有一种就是不管见啥都要骂几句的,或者直接进行人身和地域攻击,对于这样的人,我们称之为“莫得感情的喷子”或者说是“祖安人”。
而在最近有个懂技术的外国老哥-油管主播基尔彻(Yannic Kilcher)整了一个大花活,把网上那些喷子发的信息组合起来,打包丢给了人工智能,做出来了一个专门用于和网友对线的机器人。
这个人工智能的产物叫GPT-4chan,结合了网络论坛4chan里面各种糟粕的文字,作者的目的就是为了把它做成史上最糟糕的AI。话说这玩意还有点赛博朋克,作者把它丢掉论坛里,还真的有人跟这个AI对线,而没有第一时间意识到这是个机器人。来看看网友翻译的截图。
也就是说,这个AI完全可以丢在其他地方,来污染网络环境,稍加改进之后,换成其他国家语言的版本,就可以定向投放,让网络水军更加难控制。从某种角度来说,这类AI也可以作为网络舆情的武器,所以引起了大家的关注。
在聊这个AI之前,有必要先来看看4chan是个什么东西,4chan每过一段时间都会火出圈,在互联网上看到一下这论坛的名字,简单来说就是一个匿名的社区,大家可以随便发一些比较偏激的讨论,通常被认为是外网与一些阴暗的里网的交界处。毕竟人一旦匿名,那说起话来就不管后果的,所以你可以想象这里大概会充斥着哪些内容。
说起这个论坛,还有一件事也可以提一下,那就是快播的王欣在出狱之后,就想做一个类似这样叫做“马桶”的软件,大家也能匿名来释放自己的情绪。
结果可想而知,这个“马桶”项目还没啥人知道就夭折了,毕竟现在讲究的是:互联网不是法外之地。互联网初期群魔乱舞的时代已经过去了,这样不受管制的社区出来也是404,想法很好,时机不对。
说回这次的AI主角,GPT-4chan可以算得上是喷子的集大成者了,作者给这个模型投喂了网友在3年半的时间内,在论坛里发的激进对喷数据,累计超过1.345亿个帖子,用语言模型训练完数据之后,就匆匆上线跑起来了,这个机器人每天可以发几千条的消息,唯一区分的标记就是一面塞舌尔国旗-因为发帖会显示IP来源。作者把它丢在了远程服务器,开了7000多个线程同时跑,然后一天就整了3万多个帖子。
这个机器人不只是单纯回复不着调的话,还会根据帖子内容进行有模有样的分析,反讽,吐槽,甚至是联系上下文来作答,也就是说你还可以跟它“聊起来”,作者是这么评价GPT-4chan的:
“在一个可怕的意义上,这个模型很好。它完美地概括了/pol/上渗透到大多数帖子中的攻击性、虚无主义、欺骗和对任何信息的极度不信任。它可以响应上下文,并连贯地谈论在最后一次训练数据收集后很久才发生的事情和事件。”
也就是说,以一己之力,就可以让网络社区充满乌烟瘴气的感觉,这才运行了两三天,要是一直做好保密工作,在平台上悄悄投放下去,然后平台的检测软件也没发现异常的话,那么作者的目的就达到了,他就成功验证了自己的想法,即使互联网上大多是机器人发的信息,大家也不会觉得奇怪。
而作者的这个想法,还与世界首富马斯克相关,因为马斯克之前说收购推特的时候,说推特上面有5%的都是机器人。
作者就想看看一个平台有多少机器人才会让人觉得不对劲,结果实验还不错,给大家开了一个带有黑色幽默的玩笑。
但是好在,作者及时停止了这个邪恶的机器人,并且把开放的模型数据撤回了,但在撤回之前,数据模型已经被下载了千余次。好家伙,打开了这个思路之后,应该有不少其他人也会开始整花活。
说起整活,这其实不是聊天机器人第一次出圈了,就连日常使用的语音助手,Siri、小爱同学等等都会翻车。而这些所谓人工智能训练出来的模型,如果带有自主学习的模式,最后被玩坏的概率非常大。
不知道大家还记不记得,在2016年,微软在推特也发布了一个叫做Tay的AI聊天机器人,结果不到一天也学会了祖安技能,种族主义和煽动性言论拉满,微软官方急冲冲把这个机器人下架了。
关于人工智能在聊天方面的发展,在前几天还有一则有趣的新闻。
谷歌有个员工测试聊天机器人,结果还真的聊出感情来了,称这个AI是有意识的,结果被谷歌官方请去休假了。
由此可见,现在的人工智能技术虽然还有很长的路要走,但也取得了一定的成就,智能驾驶、医学影像分析、图像处理仿真模拟等等,都迎来发展的契机,之前还有大神自己搭建了一个网站,只要上传医院拍的片,就能免费用AI来检测是否有乳腺癌的症状,据说准确率还非常高,非常不错。
然而也正是因为人工智能和深度学习技术的发展,现在网络上的造假也变得简单了起来。声音能伪造,动态的视频也能通过一张图片进行替换,直播更是能实时换头,用AI输入文字就能生成画,最新的DELL2模型还能输入文字来生成指定内容的视频。现在的网络环境,可谓是越来越不真实了。
除了人为操控的网络环境,现在机器人水军也切切实实发生在我们身边,之前各平台开启显示IP地址来源之后,大家也都知道了确实有人在操纵网络舆论。而GPT-4chan这样的工具出现,会让公共网络社交空间变得更加复杂,再往后还有所谓的元宇宙、Web3、去中心化等等下一代网络雏形。
一个“群魔乱舞”的网络环境结束了,下一个“群魔乱舞”的网络来了。如今互联网最吸引人注意力,又最浪费着人们的精力,当被网络上的人影响情绪的时候,现实的行动也会被潜移默化的影响,最终只剩下:忍一时越想越气,退一步越想越亏。然而,互联网上信息那么多,很多时候就需要分清,哪些情况下你可以挑选信息,哪些情况下的信息是某些人强加给你的。
信息时代应该掌握有价值的信息,希望大家不要成为恶意信息的制造者,或者被恶意信息所淹没。