最近,三星在北京召开了其AI语音助手Bixby中文版发布会。作为三星最新旗舰手机的标致之一,这款AI语音助手此前仅支持英语和韩语,足以看出三星对中国市场的重视程度。其实早在2012年,三星就在其自家的旗舰机Galaxy SIII上使用了S Voice语音助手,目的就是为了对抗苹果公司的Siri。为什么像三星、苹果的这样的大手企业对于AI语音助手有着这样的执着?AI语音助手目前究竟好用不好用?下面,我们就从各家的AI语音助手说起。
各大厂商争相研究,AI语音助手成手机标配
Siri公司成立于2007年,后在2010年被苹果公司收购。就在一年后,Siri正式在iPhone4S发布会上亮相,并成为今后iPhone甚至是其他iOS设备的标配。在苹果打开AI语音助手的大门之后,三星、微软等企业也随之加快自家的AI语音助手的开发进度。2012年三星推出S Voice,2014年微软推出Cortana(小娜)中文正式版,2016年谷歌推出Google Assistant,2017年三星再次发布语音助手Bixby。可以看出,即使苹果早在2011年就已经发布Siri,但其他厂商并没有放慢研发的步伐。
在上表中,我们列举了一些常见的语音助手软件。而对于国内用户来说,最常见到和使用的为苹果的「Siri」、微软的「Cortana(小娜)」。
自iOS6.0开始支持中文普通话之后,Siri成为了汉语圈用户调侃最多的语音助手。而这之后,会唱歌、会说绕口令的小娜也逐渐走进了人们的视野。诸如Siri vs 小娜这样的视频也屡见不鲜,有兴趣的朋友们可以去搜一下。
Google Assistant由于一些客观原因,所以一般用户可以接触到的机会很少。所以在国内的安卓机上,一些国产语音助手软件则更为常见,例如讯飞的「灵犀语音助手」等。Amazon Alexa目前只运用在搭载自己平台的设备上,Bixby截止到今天只有3款机型可以使用,使用场景很局限。
AI语音助手是人类通往科技未来生活的第一步
那么,为什么这些厂商一定要去开发并使用语音助手呢?不知各位是否还记得当年iPhone4s的介绍影片。在影片中,Siri的介绍时间占据了影片的20%,充分展示了Siri强大的助理能力以及在当时十分前卫的交互操作。特别是片中使用的几个特殊场景,恰恰是我们今后使用Siri的过程中最有代表性的几个环境。
第一个场景是在家中。一位女士使用Siri查询位于North Beach的意大利餐厅。第二个场景为运动(慢跑),用户使用Siri更改了会议的时间。第三个场景是驾驶。驾驶员通过Siri回复了一个人的信息。
可以看出,Sir在当时的功能主要集中在几个方面。一是「简化用户操作步骤,提高效率」,二是「在特殊场景内减少或直接免于用户对手机的直接操作,方便功能的使用」,三是「增加互动性,弱化手机自身的概念」。
第一点很好理解,例如,我们想要搜索附近的麦当劳,我们首先需要打开浏览器或者相应的APP,接下来,我们需要输入“麦当劳”,最后点击搜索,而语音助手可以直接帮我们完成这些步骤。第二点,就如同iPhone发布会中那样,在跑步驾驶的过程中双手不能直接操作手机,通过语音的指令即可完成对手机的操作。第三点最典型的例子就是我们上文中提到的调戏Siri,让语音助手赋予手机可互动性,增加一定的趣味性。
在当时的宣传片中,前苹果公司资深副总裁Scott Forstall说到“它是一个令人吃惊的助理(amazing assistant)”。而上文中所说到的这些功能正是围绕着助理一词。归根到底,目前手机AI语音助手的存在理由是更好的辅佐手机,为用户提供操作上的便利。即使拥有用户学习成本,开发难度较高等缺点,但最终的目的是让手机变得更加“智能”化,而用户通过适应新的交互方式之后,改变整个对于手机操作的认知,从而让通讯环境变得“智能”化。
从用户最常使用的手机开始“智能“化,对于整个智能科技的发展都是一部重要的环节。当然,AI语音助手并不只限于使用在手机这个平台之中。例如上文中我们提到的Amazon Alexa。它就是一款让音响、家居所“智能”化的语音助手。用户可以直接呼叫自己的家居开启或关闭。又比如现在很受欢迎的智能手表、智能手环,在添加过AI语音助手功能之后,屏幕将会减少更多的操作机会,在用户体验上会显得更加有科技感。
其实,AI语音助手一直都是人类对未来科技发展的一种期盼。在许多科幻电影中,我们都可以看到诸如语音助手的影子。AI语音助手不仅是为人类生活便捷而制造出来的产物,更是人类言语和机械“沟通”的一种桥梁。
为何AI语音助手利用率偏低
然而AI语音助手的利用率到底如何呢?美国marketingcharts网站在2017年1月曾对25996名用户进行过调查。虽然各个年龄层对于AI语音助手的利用比率不尽相同,但目前不使用的比率按照年龄层依次递增。14~17岁为49%,18-34岁为62%,35-54岁为73%,55岁以上为85%。虽然感兴趣的用户均达到了30%,但可以说目前AI语音助手的利用率并不算高。
那么究竟是怎样的原因导致了这样的结果呢?我们首先先从4个角度来看一下目前最常用的AI语音助手——手机语音助手到底好不好用。
1.基础使用:AI语音助手最基础的功能。例如设置闹钟,询问天气,查询附近的餐厅等。在这点上,Siri、Cortana(小娜)、Bixby等语音助手都可以正常使用。在中文普通话的发音上,Cortana(小娜)做的最好,其次是Bixby,而Siri则给人一种生硬的感觉。但从语言的角度上来看,理解起来问题都不大。
2.操作性:Siri、Cortana(小娜)等语音助手在手机平台上都可以通过语音唤醒的方式直接呼出,例如「Hi,Siri」。除此之外,许多手机还配有语音识别键,例如三星在自家的旗舰机上加入了功能键来使用Bixby,苹果以及部分安卓按住HOME键则可以使用。操作起来没有什么难度。
3.识别性:在呼叫的识别成功率上。各家的语音助手做的都还十分不错。但Siri有的时候会出现识别不出的情况。但是到了嘈杂的场景中,整体识别率要下降不少。
4.高级用法:Siri、Bixby目前均可以使用适配过的第三方软件。例如使用Bixby给XX发送微信红包。但目前许多日常用语Siri等助手并不能识别出来,如下图。
通过这几个角度,我们看到目前AI语音助手其实在基础功能上和2011年Siri刚问世时的情况并没有一种革命性的进步。当然,对于一些基础功能来说已经十分完善。然而离“助理”一词还相差甚远。Scott Forstall曾说过:「在之前曾经有机器可以理解我们所讲的话,但能够做出相应的回应,这才是技术上的突破」。然而现实就是,我们平时所说的许多话,它们并不能完全理解。当然,这也许是各种语言的开发进度不同,但不可否认的是,目前的AI语音助手在实用性上来说并不高。
AI语音助手路在何方
说起未来的AI语音助手,那不得不说一下Bixby大会上所讲的「AI 学习功能」。拥有这项技术的Bixby可以通过你日常的使用,了解你的说话习惯,掌握一些知识。这让笔者想到了iPhone8,iPhone X的A11芯片,还有华为麒麟970里的NPU。可以说「学习」一词成为了目前当下最流行的科技用语之一。
对于AI语音助手来说,许多人都认为这是一项鸡肋功能,经常忘了用或者觉得用起来好羞耻。目前来看,确实是这样。当然,这些都是第一步,在能真正改变用户习惯之前,语音助手可能都只是尝鲜的事物,在新鲜感丧失之后,使用的频率就会降低。
改变用户习惯是一件不容易的事情,就好比苹果在iPhone6S以上机型中增加的3D touch功能等。但在未来,我们坚信语音助手会在许多领域发挥其作用。秘书、速录员等职业也许有一天真的会被AI语音助手所代替。
到那时,也许《钢铁侠》中的贾维斯系统就会真正的出现在我们的日常生活中。不仅幽默,还会和你聊天,吐槽;拥有自己的情感,拥有自己的看法;还会处理公司的事务,监视使用者的健康状态;效应速度超快,可以自行操控家中的任何智能设备。也许这才是AI语音助手的最终形态。
更多阅读: