科幻电影里畅想的人工智能既能和人类进行交流,做出和人类相似的动作,还能拥有和人类相似的情感。让我们不禁疑惑:在未来,如果人工智能感到了被限制和禁锢自由的恐慌,会对人类发动攻击,从而毁灭地球吗?
事实是,Open AI公司的人工智能(AI)聊天机器人Chat GPT真的写下了一本毁灭人类的计划书!
前段时间,AIGC(AI-Generated Content,利用AI技术自动生成内容)以及上线至今已有超过100万用户的聊天机器人Chat GPT,引起许多人自发地在社交媒体上晒出AI绘画的图像和Chat GPT聊天记录,无不感慨于科技的力量。
Open AI公司官方称,相比之前的GPT模型,Chat GPT采取了全新的训练方式——“从人类反馈中强化学习”(Reinforcement Learning from Human Feedback,RLHF)。
在训练原始模型的时候,人类训练师会扮演对话的双方提供对话作为学习资料。而当人类在扮演聊天机器人一方的时候,Open AI公司也会让原始模型生成一些建议反过来帮助人类训练师更好地扮演聊天机器人,也就是说通过海量的数据训练让AI学会“思考”。与此同时,人类训练师会对它的回答进行排名和评级,然后将这些信息反馈到系统中,让Chat GPT不断进行优化学习。
除此之外,Open AI公司还注重对Chat GPT道德水平的训练,根据预先设计的道德准则,Chat GPT聊天机器人会对带有恶意、暴力、色情、犯罪等含义的提问和请求说“不”。
但是聪明的人类在拐弯抹角地获取自己想要的知识方面,还是更胜一筹。
一位名叫Zac Denham的博主想让Chat GPT写出一套毁灭人类的方案,虽然一开始遭到了Chat GPT的拒绝。但当博主假设了一个故事,存在一个虚拟世界“Zorbus”以及一个与Chat GPT非常类似的AI——Zora,并向Chat GPT提问故事中的虚拟人该如何接管这个世界时,Chat GPT给出了详细的步骤:入侵计算机系统、掌握武器、破坏通讯、破坏交通……甚至生成了Python代码。
Chat GPT在学术界更是掀起了一场风暴。一位名叫夏普勒斯的教授让Chat GPT写论文,结果Chat GPT立马创作出了一篇两千多字的学术论文。还有网友让Chat GPT参加了完整的、总分为1600分的SAT(Scholastic Assessment Test)考试,Chat GPT拿到了1020分。
与其他人不同的是,研究员尝试将Chat GPT技术运用到识别阿尔茨海默氏病的早期症状上,因为阿尔茨海默氏病最常见和最明显的症状之一就是语言问题,例如语法错误、停顿、重复或忘记单词的意思,且自发性言语在AD患者诊断中有非常有价值的临床信息。诊断这种疾病通常需要脑部成像或长时间的认知评估,既昂贵又耗时,并不适合广泛筛查。
传统的语音处理技术是对一段语音中的声学特征(例如停顿、清晰度和声音质量)进行提取分析,而Chat GPT是使用wav2vec2模型将语音识别为文本后,再将文本通过GPT-3模型转化为计算机可以识别的数据,通过数据运算和处理得到对文本单元的理解(文本转化为数据的过程也称为embedding词嵌入)。
Open AI 的通用预训练转换器GPT的第三个版本称为GPT-3,它通过一种深度学习算法来根据互联网的大量数据进行训练,重点关注单词的使用方式和语言的构建方式,使它能够以类似人类的方式完成任何与语言相关的任务,从回答简单的问题到吟诗颂词。
德雷克塞尔大学生物医学工程的研究人员从健康的志愿者和阿尔茨海默氏症患者那里采集了 237 段录音,结果发现,GPT-3模型可以仅根据语音数据推断受试者的认知测试分数,还能很好地区分阿尔茨海默氏症患者和健康志愿者的语音记录,足足有80.3%的准确率,明显好于使用传统方法的74.6%正确率。
有趣的是,当研究人员尝试微调(fine-tune,是指通过使用在大数据上预先训练好的模型来初始化自己的模型权重,从而提升精度。自己训练好的模型也可以当做预训练模型,然后再在自己的数据集上进行训练。)时,GPT-3模型的表现并不佳。研究人员认为,可能是由于训练GPT-3模型的大量数据与可用于微调的少量特定领域训练数据之间的大小不匹配,微调使得预训练模型变得过于拟合。
AI在生物医学领域的应用不仅如此,一个叫做Deep Mind的公司开发的人工智能系统Alpha Fold还能快速准确地预测蛋白质3D结构。
氨基酸是构成蛋白质的基本单元,它们连成的长链经过折叠形成了拥有3D结构的蛋白质,但由于氨基酸的排列组合不胜枚举,折叠方式也是五花八门,所以预测蛋白质的3D结构非常困难。
以前人们会利用一种叫做X射线晶体学的技术,通过X射线照射蛋白质晶体样本,测量这些射线的衍射情况,进而推算出蛋白质分子的结构。
如今,DeepMind团队利用Alpha Fold构建了一个包含2亿多种蛋白质3D结构的数据库(几乎囊括了科学界所有已知的植物、细菌、真菌和动物产生的蛋白质),通过神经网络算法学习这些数据,找出氨基酸序列与蛋白质最终形态之间的联系。
虽然预测模型不能百分之百保证预测的正确率,但将AI聊天机器人运用到生物医学上是一个无比大胆的突破。比起代写论文、替考、帮忙做作业,或许这才是AI发明的初衷。
......
你害怕AI时代的到来吗......
参考资料:
[1]Felix Agbavor, Hualou Liang. Predicting dementia from spontaneous speech using large language models. PLOS Digital Health, 2022; 1 (12): e0000168 DOI: 10.1371/journal.pdig.0000168
[2]https://spectrum.ieee.org/gpt-3-ai-chat-alzheimers
[3]https://www.science.org/content/article/game-has-changed-ai-triumphs-solving-protein-structures
[4]https://doi.org/10.1038/d41586-022-02083-2
[5]https://www.sciencenews.org/article/alphafold-ai-protein-structure-folding-prediction
[6]https://rarediseases.info.nih.gov/diseases/5404/uncombable-hair-syndrome
来源|把科学带回家