3月16日晚间,微软宣布:正式将GPT-4接入Office全家桶。
GPT-4是OpenAI实验室在3月14日推出的新一代语言大模型,比起近期大火的ChatGPT背后的“基底”GPT-3.5,GPT-4不仅在性能上全面超越前代版本,还能在输入图像时做出相应回答,可谓是再次向业界投下一记惊雷。
而不过三天,微软就将这一最新的语言处理模型集成进了微软365全部产品线,包括Word,PowerPoint,Excel,Outlook等等,最终形成一个全新的AI系统——Microsoft 365 Copilot。
在演示中,这一系统能够通过与用户之间的文字交流自动生成文本、排版ppt、撰写邮件、生成图表,还能在微软不同产品文件间来回切换。
有观点称这次发布堪称第一代iPhone之于手机行业,有人认为这将彻底颠覆互联网的工作方式,而用微软CEO纳德拉的话来说,这是下一代人类与电脑交互的方式,也将促使人与计算机实现“共生”。
微软CEO纳德拉(Satya Nadella)
···
根据官方演示,这个叫做“副驾驶”(Copilot)的AI系统会以按钮形式出现在相应产品的任务栏中,点击图标就能唤醒。
在Word文档中,“副驾驶”首先拥有ChatGPT的功能——给出一句话,就能快速生成大段扩展描述作为初稿,也能通过多轮对话就已生成内容进行不断优化、润色。
同时,“副驾驶”也能使用更强大的文字编辑功能,直接对文字内容进行排版,还可以通过“副驾驶”随意调用微软365产品线中的任何形式的文件,比如,可以让它基于“昨天写的OneNote笔记”文件生成内容。
另一个常用产品Excel自然也不差。Excel表格中有很多功能都需要通过复杂的函数实现,而现在只需要调用“副驾驶”,用自然语言描述自己的需求,比如“向我展示某某数据的趋势”,就能快速生成相应折线图。
负责制作幻灯片的PowerPoint也一样,可以基于其他格式文件直接生成十几页内容,也能通过具体描述修改文字内容、图片排版、动画效果等等。
此外,在邮箱Outlook中,可以通过“副驾驶”的“Catch up”功能挑选更有信息量的邮件,总结对应要点,当然——也能帮助用户撰写相关邮件;在音视频会议软件Teams Meetings中,“副驾驶”也能充当会议助理,组织关键讨论要点、总结会议结论,随时引导会议进程等等。
总而言之,那些原本需要点击任务栏按钮组合各路功能、调用复杂函数,或纯靠人力实现的工作流程,现在只需要用自然语言,像日常交流一样与“副驾驶”对话,就能全部实现。
不过,截至目前,微软官方仍未透露具体测试时间,只是表示将在“未来几个月”与用户见面。
···
由于此次接入“副驾驶”的并非几个常用的Office软件,而是整个微软办公生态,也就是说,要能在不同格式的文件和不同展现形式的数据之间进行稳定的交互——这就需要一个强大的技术系统。
根据微软官方提供的资料,整个技术系统主要包含三部分:微软365产品及用户数据(作为输入)、微软365“副驾驶”AI系统(作为中枢)、语言大模型(GPT-4)。工作流程主要分为三步:
用户输入自然语言,先经过“副驾驶”转换为计算机可理解的语言后,再与用户各类格式的文件资料(Word、Excel、PowerPoint等)进行关联;
由语言大模型理解人类的需求,返回对应的输出;
最后由当前用户所用的某一Office软件结合上一步输出,自动调用相应指令,完成用户需求。
我们可以将“副驾驶”简单称之为AI助手,也可以将这整套系统理解为一种人与计算机的全新的交互方式,就像微软官网上说的那样——Copilot将您的语言变成地球上最强大的生产力工具。
而在发布会上,微软CEO纳德拉也表示,计算机的未来就是作为人类智能和人类行动的延伸,而强大的基础模型和“副驾驶”AI系统将做到这一点——这将从根本上改变计算机帮助人类思考、计划和行动的方式,就像现在的我们无法想象没有键盘、鼠标或触摸屏的计算机一样。
在科幻小说《三体》中,未来世界呈现出这样的图景:高强度互动的生活场景、随处可见的触屏投影、高度定制化的信息推荐……高度的科技发展迫使人类也发生了一种“进化”——即习惯用手在任何光滑表明发送指令,故被冠以“点墙族”的诙谐外号。
毫无疑问,微软这次推出的AI系统将把人类从很多繁琐重复的工作解放出来,但这种“人类的自然语言操控一切”的方式也将肉眼可见地对不少人的工作流程和思维方式带来影响。那么,当现实中的科技不断进步,我们是否也会像小说中的人类那样“被迫进化”,变成一种另类的“点墙族”?
未来不得而知。不过,在发布会开始时,微软副总裁贾里德(Jared Spataro)这样表示:
一百年后,我们将会回顾这一刻,并说,“那是真正的数字时代的开始。”
编译:南都记者杨博雯