近些年我们在高谈阔论显示技术和内容供应时,似乎越来越淡化了另一个直观问题:在电视上的人机交互。直到前些天苹果2015年秋季新品发布会上,演示Apple TV中Siri强大语的音识别和检索能力时,人们才叹为观止,原来语音操控也可以如此智能和流畅。这也让Apple TV成为了媒体笔下本届苹果新品发布会的一匹黑马。
五味杂陈的电视语音交互
语音交互早不是什么新鲜事了,可以追溯到十几年前的功能机时代。它最初的形态是以语音拨号来实现交互,后来进一步发展到语音打开应用、发短信等。今天的语音技术可以实现的功能越来越丰富了,人机交互的浪潮一再涌起。但是,功能虽然丰富,体验却一直不尽人意。有时候冲着电视遥控器重复说了半天,它回复给你的依然是“驴唇不对马嘴”,这个时候你肯定再也没有使用它的欲望了。
-我想看综艺节目
-抱歉,我没听清楚您讲话
-上网听歌
-即将为您打开本地音乐应用
-昨晚的电影没看完,我要接着看。
-抱歉,…………( 简直鸡同鸭讲)
三段对话展示了目前大部分电视语音交互三大鸡肋:识别率低、语意分析差、太“低能”。无论是电视厂商自主研发的语音助手,还是应用市场一捞一大把的第三方应用,笔者都禁不住要吐槽一下,如此糟糕的智能算法、如此贫乏的数据匹配、都不用联网也敢做的语音助手。这样的语音交互更像是设定好的一个对话和指令,完全谈不上智能。
当然现在还是有一些语音交互做的不错的,如苹果的Siri、微软的Cortana。苹果发布会上演示Apple TV时,它强大的Siri似乎在炫耀,我也可以和电视盒子配合得天衣无缝。当试用者说出“Show me funny tv shows”时,Apple TV立马检索到了所有的喜剧并列出;如果你在观影过程中有一句没有听清楚便可询问它,这时Siri会回放之前的内容,并智能的添加上字幕;如果你在观影过程中想了解昨天的球赛结果如何,你就可以直接询问Siri,它能在不中断当前播放的情况下在屏幕下方显示出昨天那场错过了的比赛的胜负情况。整个操作反应的过程一气呵成。
在昨天更新的iOS9正式版中,苹果还进一步优化了Siri,可以“嘿Siri”培训它,让它更好的识别主人的声音。
而Cortana则更像是大数据时代,微软的一次人工智能方面的尝试。用户与小娜的智能交互,不是简单地基于存储式的问答,而是对话。它会记录用户的行为和使用习惯,利用云计算、搜索引擎和“非结构化数据”分析,读取和“学习”包括智能设备中的文本文件、电子邮件、图片、视频等数据,来理解用户的语义和语境,从而实现人机交互。网络上也曾一度流传各种调侃微软小娜和小冰的段子,其强大的语义分析和灵活的回答方式是目前智能语音当之无愧的王者。
智能电视为什么要语音交互
现阶段大部分智能电视的语音交互提升的空间都还很大,那有人要问了,我为什么一定要语音助理呢?我用遥控其一样很爽呀,而且现在大部分遥控都有方便的快捷键以及丰富的体感操控,没必要对着遥控器说话。很荣幸的告诉你提出这种质疑说明你还不够“懒”,没有懒得不愿意动弹就想看到自己喜欢的电视内容。但是又很遗憾的告诉你,大多数的黑科技都是为“懒人”盛装准备的。
究其根本,语音功能只是电视介入互联网搜索的方式之一,不过它对人工智能的要求非常高,语言是人类独有的文明传播方式,要让电脑理解它浩大的语境语义,难度非常之高。但是如果换一个角度想,将语音当作用户使用习惯的收集工具,将大数据统计处理,然后反哺到语音功能的体验上,那么智能语音的发展会不会既完善又迅速呢?
非智能电视时代当我们打开电视时,看到的就只是电视,不会出现一个主页面,也不会有那么多图标点来点去,我们只在乎我们打开电视马上就能看到什么。我希望智能电视也是这样,把所有软件都放在另外一个界面里。当你累了一整天不愿意动弹,回家就想看点自己喜欢的节目打发时间,如果只需要对着电视说“开机”他就能自动跳转到你喜欢的电视节目中,那该是多么惬意。
如果你不希望语音助理替你思考,那么你需要做得事情是通过语音助手来搜索,而且它能很迅速的找到你想要的内容,把那些需要特定服务、特定地址、糟糕画质的电视节目统统排除掉,为你提供最优的选择,就像精准的搜索引擎一样。
语音交互带来的是继搜索引擎、浏览器、智能手机OS之后,第四代的入口。智能电视的语音交互能让你迅速的回到电视的根本,打开电视看电视节目,就这样而已。
总结:自从智能设备问世依赖,你有没有发现自己对它们的依赖越来越严重?与它们的交互越来越频繁?而且开始觉得现在的操控方式复杂、效率低下,迫切的需要一种更为简单的操作方式。语音交互就是智能交互的一个重要的基础,随着人工算法实现功能上的智能化、大数据形成大量的语言模型。智能电视端的语音交互将会突破“听”,实现“懂”,真正成为你的智能助理。