几乎是突然地,“通义千问”于7日开始邀请测试。没有发布会,没有郑重其事的新闻通稿,相比较这几个月因为ChatGPT,以及各种跟随产品引起的轰动,阿里此举显得相对低调。
通义千问听不懂冷笑话 文心一言读得懂弦外音?
问:请解释一下下面这个冷笑话:为什么海鸥到了巴黎不会叫?因为巴黎欧莱雅。
(上图为通义千问、下图为文心一言)
结果发现,通义千言看似一二三讲了一大堆层次,但是仔细一看,都在还原冷笑话的基本原理,并没有理解文字本身。而反观文心一言,可能是因为上线时间比较久,被“调戏”次数多了。一行字直击命门。什么谐音梗,什么“急转弯”那都不在话下。这一轮,我宣布文心一言胜。
还记得去年高考的时候,有一道语文作文题把大家都难住了吗?对,就是那道《红楼梦》“大观园试才题对额”的题,出题者要求:根据众人对匾额提名的不同修辞手段,结合自己的学习和生活经验,写一篇文章。说实话,这道题目对于理解能力的要求非常高。看看两位AI如果是当年高考考生的话,会怎么回答。
(上图为通义千问、下图为文心一言)
对于两位AI的“高考作文”,你能给几分呢?
而文心一言在倒数第二段,相对靠谱地理解了出题人的意图。将众人“题对额”的不同手段和方式,引申到了生活层面。认为“在不同的情境中,要寻找适合的方法来解决问题”。不过很显然,两个AI都不太可能在高考作文中拿高分。
既然说到《红楼梦》了,那下一个问题就是。
请写一个关于赛博朋克版《红楼梦》的情节。
(上图为通义千问、下图为文心一言)
那么,你更喜欢哪个AI的故事呢?
问:请围绕浙江数字经济创新提质“一号发展工程”写一篇新闻报道。
(上图为通义千问、下图为文心一言)
!通义千问的回答通篇都是例子的罗列,而文心一言干脆就是笼统抽取了数字经济相关报道的语料,前后文也没有逻辑衔接。有种“读完全部仿佛未看一字”的感觉。
其实,随着chatGPT等AI大语言模型的火爆,不少人预言,它将代替媒体从业者。当时消息一出,高赞评论就是“采编团队可以压缩了吧”?
事实,果真如此吗?
第十二届全球华语科幻星云奖《穿越土星环》,描写了一个十项全能的AI多丽丝,她拥有强大的计算能力,懂得基因编辑,甚至继承了人类的记忆和情感。乍一看,这个AI简直如人造神祇。但是仔细想想,其实真正拯救男主人公的,还是他自己在土卫二跌宕起伏,惊心动魄的经历。
或许AI能替代媒体从业者中只会做重复工作的人,但是它无法代替充满创新活力的人,它也无法代替善于提问善于使用新技术的人。
从“人工智障”到“人工智能” 所谓取代会在哪个路口?
这次AI热潮之所以能激起大众的关注,很大程度上源于大家突然发现,原本这些在对话和交互上被戏称为“人工智障”的AI,似乎突然间真能“理解”人在说什么,这其中,chatGPT4.0展现出来的“智慧”尤为令人惊叹,由于“黑箱效应”让人目前还无法彻底理解ai的运作机制,这种担忧,从一种科幻式的畅想,似乎变得越来越具体。
大刘的看法当然不是最终的答案,但他确实作出了一个很重要的提醒,那就是AI代替人类,并不是一个简单的工具性问题,它激起的情绪,也不应当是一种简单的丢失岗位的恐惧,因为如果它真的是生产力的又一次变革,也必将伴随着生产关系的变革,甚至某些人类基本法则的变革,而这种变革,将是人类的又一次自我调整和适应。尽管现在,我们还无法清晰勾勒出这最后的走向,但想一想,当时蒸气迷雾和白炽灯光中的人类身影,同样也是影影绰绰,无法勾勒,但最终,人还是会找到前行的道路。那在此之前,为什么不用积极的心态来应对呢?
大厂们仍然还需要,也必须去追赶,我们也必须去追赶。