你的“私人助理”还可以更聪明 浅谈国内外智能语音助手

家庭影院技术 2019-12-03 14:00:19

不管是智能手机,亦或是智能手表、音箱、手提电脑等数码产品,搭载语音助手已成为一项必不可少的附带功能。智能越火热,语音助手就越流行,仿佛少了语音控制,一件电子产品就缺失了该有的科技味。然而,消费者真的那么依赖智能语音助手吗?以Siri为例,根据调研机构Verto Analytics的统计,苹果用户对Siri的使用率仅为19.6%,依赖率仅为11%,每位用户每月平均使用时间大致只有14分钟。基于好奇,笔者也特地询问了几个亲朋友好日常使用语音助手的频率,几乎大部分人的回答都是:一般情况都是两手实在腾不开时,才会去主动下达一些简单的功能指令,比如“播音乐”、 “打电话给某人”或“设置闹钟”。无论是被玩坏的Siri还是“高情商”的小爱同学,俨然我们的生活已经无法忽略智能语音助手的存在了。

7大国外语音助手同台竞技

Siri是最“蠢”的语音助手

Siri诞生于2011年iPhone 4S面世之年,它几乎是最早亮相的移动端智能语音助手。尽管占领了优先发布的优势,但显然苹果没有抓住先机,后续发布的Google Assistant以及亚马逊的Alexa,频频被用户、媒体认为比Siri更好用、更人性化。不知道各位在“挑逗”Siri时,是否都说过这样一句话, “Siri你怎么那么蠢”?

实际上,我们认为Siri “蠢”也并非口说无凭,早前外国资讯公司Stone Temple就曾将Google Assistant (三个版本,分别是Google Assistant Smartphone、Google Home上的GoogleAssistant以及Google Home Hub上的Google Assistant)、Cortana、Alexa、Siri、Echo show等7个语音助手的能力做了一次详细测试(从2017年开始,该司每年都会做一次对比测试,以下数据为2019年版本)。

这项测试的问题多达到4999个,其中一项“错误回复数量”的调查数据显示,Siri是回答问题错误次数最多的语音智能助手,数量接近300次。Echo show与Alexa分别排名第二和第三,两者均达到了200余次。需要表明的是,这些错误大部分指的是含糊的查询回应,这点我想各位用户在iPhone的Siri上都深有体会。比如我们问“某个演员出现在哪几部电影上”,Siri只会弹出某个关键词(例如演员)的搜索资料。所幸的是,这份报告表示7个智能语音助手都没有出现过误导用户的错误答案。

准确率方面,Google Assistant Smartphone完全回答正确问题的准确率几乎接近90%,是排名最高的智能语音助手。Google Home、Google Home Hub位于Smartphone版本之后,可完全回答正确问题的准确率并不会与其相差太远。Siri和微软的Cortana是排名最后的两位智能语音助手,综合“尝试答案(指理解问题并明显做出了努力回答)”和“完全正确答案”的数据比例显示,Siri仍是7位智能语音助手里“最不聪明”那一个。

未来智能语音助手应有的样子

更在乎交互能力的Google Assistant

对于Google Assistant今天取得成绩,着实不令人感到意外。有关注科技圈的朋友都知道,Google向来非常注重AI领域的发展,自2016年Google Assistant首次出现之后,每一届Google I/O大会都是以AI为主题(2017年开始Google将AI定义为未来公司发展方向)。当然,如今再总结一次这几年Google I/O大会都带来了什么已再无意义,缺乏耐心的消费者往往最关心的都是最终结果,那就是“Google Assistant如今能做到何种程度?”。

在AI的支持下,Google Assistant的聪明不再只是围绕搜集世界各地的信息,而是转而更好地为用户解决问题。Google在内容引擎里融入了AR技术,搜寻内容除了弹出常规的文字介绍以及图片之外,还会有AR效果的演示,不仅增加了搜索内容的丰富性,还极大帮助了我们的深入了解。比如我们想知道金丝猴具体长什么样子,得到的不再是冷冰冰的硬照,而是出现在你旁边活灵活现的三维效果,当然一切前提是它(内容)拥有相应的AR拓展。

我们所接触的智能语音助手大部分都是非常基础的架构,它们问一句答一句,且部分反馈动作都是经过了提前设定,冷冰冰的机器人声音与不怎么样智能的体验,让用户认定了“智障”语音助手。Google经过了长时间的投入研究,如今落地在用户上的AI已经可以理解用户的个人需求,并能够通过不断积累自主深入学习。经过进化的Google Assistant可以用户为中心,并站在用户的角度解决问题。比如询问它现在去妈妈家的交通情况如何,它不会问你“妈妈家”是指一家餐厅还是别的地方,而是实实在在地为你指引你母亲家的交通情况。

再而是在控制APP之间的关联性,Google Assistant如今已经可以在多个APP里自由穿梭,实现多重联动。此外,Google还为有听力障碍的用户提供了一个非常贴心的功能,它可以将沟通对方说的话实时翻译在屏幕上面。在观看无字幕视频里,它也可根据将视频里的对话生成字幕,就算是普通人观看静音视频,也能通过字幕了解视频里的对话内容。这就是GoogleAssistant,不但擅长回答问题,还能帮助你解决问题。

Google-Assistant.-Photo-CNET-e1525936978480.jpg

亚马逊:比起卖货,我们更想留住客户资源

亚马逊Echo是首个搭载语音助手的智能音箱,于2104年11月首次出现。它与Google在AI上的布局多少存在着一些差异,亚马逊更在乎在硬件以及内容上的拓展。如今,亚马逊已围绕着Alexa智能语音助手推出了一系列硬件产品,包括更高性能的智能音箱、烤箱、插座、灯具、眼镜以及针对宠物的智能设备。你可能会对Echo Loop智能戒指感到匪夷所思,但亚马逊的目的就是在这些设备上不断开发Alexa的技能。截止到今年3月,亚马逊Alexa平台已有近8万项技能。

海量技能以及覆盖不同领域的硬件产品,这一势头难免让人怀疑亚马逊的意图主要是卖货。不过,今年Alexa硬件大会上亚马逊高级副总裁戴夫·林普就已向媒体澄清,产品不作为利润中心,目的只是为了提高用户黏度。即便如此,亚马逊在智能音箱方面的出货量仍然常年位居全球第一,今年Q2季度Echo系列出货量约达到了660万台,相当于占领了当季全球出货量20%的份额。虽然暂且不必担心竞争对手在硬件以及内容规模上超越自己,但亚马逊仍然不能忽视Google、Siri的不断扩大,主要原因在于Alexa缺少了类似苹果Siri那样的手机端支持,或GoogleAssistant更人性化的学习交互能力。

microsoft-cortana-with-ios-siri.png

各显神通,国内智能行业已初露形态

国内智能语音助手落地到用户上的攻略几乎大同小异,以低价营销走量,用智能音箱抢夺智能家居入口的影响力。借阿里巴巴的天猫精灵举例,说它是开启国内智能音箱价格战的鼻祖也不无道理,毕竟当时的价格屠夫——小米小爱同学,也至少需要299元。再者,智能音箱从2014年就已在大洋彼岸火了,而国内仍处于一片空白之中,对于抢先开拓市场的巨头来说,盈利自然比教育消费者更加重要。借助双十一以及电商平台优势,天猫精灵的销量仅用两年时间就已做到了国内数一数二的位置。国内智能语音助手也尤为注重生态系统方面的布局,今年9月,阿里巴巴在人工智能实验室云栖大会上宣布,目前天猫精灵已成为最大的loT生态开放平台。

后来居上的百度依靠AI成功转型,在我们孜孜不倦吐槽百度搜索引擎如何难用的同时,它也正悄悄做了更多事情弥补在国内的风评。虽然时至今日,百度旗下的产品依然拥有许多不足之处,但作为一间科技公司,百度也正在试图改变中国人的生活。相信大家近两年看过不少自动驾驶技术的新闻,除了特斯拉之外,百度在该领域上亦有涉及,并已做出了一些小成果。而在小度AI助手上,百度则是像Google那样,将机械式的一问一答变成为更人性化的交互。

1537845551375281.jpg

在影音产品中,语音助手充当着什么角色

全民智能的年代,影音产品也难逃“私人助理”的诱惑,不管是投影机、音箱还是功放,这几年可感受到不少厂家也受到了市场热点的感染。虽在传统投影产品里仍然非常罕见,但走大众路线的激光电视、智能投影机,已有不少品牌加入支持语音助手。这些产品大部分将拾取语音指令的麦克风转移在遥控器身上,这样可以免除用户每次唤起语音助手时,都需对着投影机大声喊话的尴尬情景。包括影音行业里火热的客厅影院音箱系统,为了吸引消费者的注意,他们不少选择通过增加语音助手提高产品的娱乐性。其实语音助手在家庭影院系统里,更像是一个类似但胜于遥控器的辅助。比如用户在看电影期间,心血来潮想转为听音乐,原本从退出电影到进入音乐区需要3~5个步骤,但通过语音助手,只需要一句“XX,请播放周杰伦的《稻香》”就能够轻松切换。

国外音响品牌大部分都是内置Google Assistant或亚马逊Alexa,国内自然是腾讯、百度系以及其它芯片厂商的智能语音助手居多。从目前了解到的情况看来,不管是国内还是国外,内置在影音系产品里语音助手大部分功能与智能音箱别无二致。千篇一律的语音操控基本功能以及靠智能手机就能取代的内容资源,这些功能还远远不及用户心中的“真智能”交互。只是今天我们虽然还在嘲笑语音助手“智障”,但从另一角度去想,这些看起来微不足道的功能,何尝又不是在简化你的工作?

lg2018oled-2l.jpg

总结

最近,一则关于智能音箱的国外趣闻引起了网友注意。来自日本电气通信大学和美国密歇根大学科学家通过实验,用一束激光,即可使Google、亚马逊和苹果的智能音箱彻底“黑”掉。为何这束激光那么神奇?原来科学家通过一种特定的频率(类似人类的语音信号)去调整激光的强度,激光便会用同样的频率干扰麦克风,接着麦克风会把光波解调成电信号。于是乎,智能音箱便错认为接收到了主人的指令,将家里的车库门、电灯等设备通通打开。虽然听起来有点滑稽,但另一方面也揭露了智能语音助手的安全隐患。无论如何想,如今落地在平民百姓的智能语音助手尚且处于刚起步的状态,我们还未知未来它将会以一个什么样的形态为人类服务,至少今天仍然有不少科学家在为此奋斗中。 

编辑:邓妍

为你推荐

全部评论

X