前言
最近两年的兴起,人工智能似乎真的终结了它前30年的寒冬。
作为一个时代的代名词,人工智能备受瞩目,从世界范围内参与其中的知名公司就可窥见一斑。虽然在2016年(2016年被称为人工智能元年)才被打上时代烙印,但人工智能其实已经拥有60多年的历史,并历经2次起落。在80年代,以数理逻辑为核心的体制瓦解后,人工智能分化出了五大独立学科。
在这五大学科中,由深度学习推动,并顺利从科研实验室走到人们身边的智能语音,某种程度上承担了人工智能这两年的大部分热度。智能语音在2016年被美国权威杂志《麻省理工科技评论》评为当年的十大突破科技,根据易观·工信部数据,2017年中国语音产业规模就将突破百亿。
说到智能语音就不能不提谷歌,5月份谷歌刚展示了一款新的人工智能语音合成器Duplex,可以与人自然交流并不被对方所识别,虽然引起了广泛争议,但也代表着这可能是智能语音目前最高成就,而这款虚拟语音助手更有可能被应用到家居场景,一如谷歌之前部署的智能音箱占据了智能家居的主导地位。
智能家居与智能语音的结合更具有天然的入口和优势,有数据预估,2018年的智能家居市场规模将突破1600亿。我们都知道智能语音的载体目前最有代表性的产品是智能音箱,不过国内的智能音箱市场虽然热闹,但是销量并不乐观,这与国内用户的家居场景习惯关系很大,而同样拥有智能语音功能的智能电视则拥有更扎实的用户基础。
随着智能语音功能的革新,智能电视的“智能”会越来越成为用户的选择要素,那搭载什么智能语音系统的电视更加智能?哪家的智能语音交互更流畅呢?ZNDS评测菌选了四款电视来对比横评,智能语音的趋势有目共睹,大家一起来看看吧。
一、四款电视的语音系统介绍
智能语音领域,国外打得火热,国内也不遑多让。继科大讯飞、捷通华声之后,BAT、搜狗、思必驰、云知声、同行者等都纷纷入局,现在大多智能语音产品的语音方案不会超出以上范围,不过各家的语音方案都有不同的侧重,因此在对比横评开始前,我们还是先了解一下四款电视的语音系统背景。
长虹CHiQ电视50Q5T:
长虹与腾讯合作,在长虹新一代智能电视上加入腾讯叮当AI助手作为语音方案。
长虹AI3.0由腾讯叮当提供技术支持,腾讯叮当基于自主研发的AI技术,完全整合语音唤醒、语音识别、语义理解、知识图谱、图像识别、音乐识别等技术,历经2年多建立了全栈智能能力,同时深度结合用户查看资讯、旅行、听音乐、娱乐等应用场景,背靠腾讯输出众多优质内容,并提供服务调用。
创维55Q6A悬浮屏AI电视与TCL 49C6 全面屏哈曼卡顿电视:
创维的小维AI与TCL的小T语音助手方案都来自与百度DuerOS的深度合作,这里我们就放在一起介绍。
DuerOS是百度度秘事业部研发的对话式人工智能操作系统,DuerOS整合了百度的信息与服务生态优势,打造了10大类目250多项功能,核心层技术包括语音识别、语音合成、自然语言处理及对话技术以及知识图谱等丰富数据。虽然都是基于DuerOS技术合作,不过因为电视其他方案的完全不同,小维与小T在语音表现上也会有差异。
小米电视4A 50寸:
小米电视与前面三款电视不同,小米电视4A是在整合了三角兽、薄言RSVP等团队,以及搜狗ASR语音识别技术的基础上,由小米大脑NLP团队与机器视觉团队经过三年打造而成,支持搜索电影、控制播放进度、图像识别、天气查询等应用场景。
二、语音交互界面对比
在了解了四款智能电视的语音方案之后,赶紧和评测菌一起来体验看看,到底哪款智能语音系统是真的智能且好用!
在给电视发出指令之前,大家其实很容易忽略掉语音用户交互界面(VUI),长按电视的语音按键,电视桌面上就会出现相应的VUI。
长虹:长虹电视的语音交互界面是深色自然渲染过渡色块,中间一条声纹波,上面是用户说的内容,下面则是示例指令。如果觉得示例指令不够多,可以询问“你会什么”,电视就会跳出类似关键词的提示页面。
(上图仅做界面展示,不表示搜索速度)
创维:创维电视的语音交互界面是底部上浮色块,在底部中央,出现科技蓝电波一样的图案,搜索响应过程中会变成光线小火箭左右滑动。
(上图仅做界面展示,不表示搜索速度)
TCL:TCL电视的语音交互界面类似地平线的形状,也是科技蓝亮光光线,上方会有浅色的示例指令。长按还会出现示例对话的功能介绍页面,对于用户来说,提供搜索范围和范例,大大降低了学习成本。
(上图仅做界面展示,不表示搜索速度)
小米:小米电视的语音交互界面在手机上也比较常见,一个语音标志,圆周散发出七色声波,语音输入时,文本就会出现在这个图标的上方。示例对话以菜单的形式展现,当小米无法识别语音时,也会跳出该界面。
(上图仅做界面展示,不表示搜索速度)
通过VUI设计的细节对比,不难看出在电视大屏界面上,更多电视采用的是线型效果,蓝光也与电视桌面的UI设计相结合,层次分明,易于识别。至于示例对话页面,这个页面主要是让新用户来熟悉使用的,没有或者经常跳出对用户的体验都不是很好,长虹将功能二级隐藏,并且展示界面中根据不同的场景提供简短的示例就比较友好了。当然了,这只是细节上的小小优劣,接下来我们开始真正的智能语音体验。
三、信息检索+多轮对话对比
为了真实反映测试结果,评测菌基于大家常见的几个使用场景来说明其中所蕴含的技术,并且对体验做出评估,相信大家看完会对智能电视的智能语音有个大致的了解,以便日后的选择。
1.语音搜索:搜索时长、文本输入
智能语音技术应用到智能电视上,主要功能就是信息的检索,包括视频、音乐、短视频等内容。在语音搜索这块,主要考察电视的响应速度和精准度怎么样。
长虹:
创维:
TCL:
小米:
评测菌语音搜索“小猪佩奇”,四款电视的响应速度从高到低依次是长虹>TCL>小米>创维,相差不过毫秒,这是初次使用的响应速度,电视使用久了,相信这个差距会拉大。精准度从高到低依次是长虹>TCL>创维>小米,小米电视有时可能就要说两遍指令才能听清,其他三款电视的精准度区别主要在语音识别的文本输出上。
还有个有趣的现象是,长虹电视与创维电视在搜索之后直接点播,而TCL和小米则只呈现视频图谱。
2.视频图谱检索+多轮对话
视频图谱检索很常见了,我们来说说什么是多轮对话。
多轮对话的场景还蛮常见的,比如说,“我想看喜剧”,然后你看到电视筛选结果没有你想看的,就可以接着说“周星驰主演的”,智能语音必须要结合上下文语义,才能知道你想要的是“周星驰主演的喜剧”这个结果。
长虹:
(上图仅做界面展示,不表示搜索速度)
创维:
(上图仅做界面展示,不表示搜索速度)
TCL:
(上图仅做界面展示,不表示搜索速度)
小米:
(上图仅做界面展示,不表示搜索速度)
评测菌对四款电视做出了“我想看悬疑电影”→“美国的”→“小李子主演的”三轮对话,长虹、TCL以及创维可以完成以上对话,小米电视没有完成,评测菌又测试了其他问题,大概确定小米只能完成两轮对话。
在完成三轮对话的三款电视里,创维电视以左上角标签形式筛选,TCL电视是以上方中央消息形式筛选,而长虹电视则在下方语音界面中完成对话,更符合语音交互的概念。
3.音乐图谱检索
打开电视,看累了视频,听听音乐,语音输入“我想听周杰伦最新一张专辑的歌”,长虹、TCL、创维电视都与QQ音乐合作,反馈回来的界面都是周杰伦音乐播放界面,TCL电视则展示的是周杰伦搜索界面的歌单。而小米电视用音乐图谱展示了周杰伦相关的“音乐片”。
长虹:
创维:
TCL:
小米:
4.短视频新闻
现在短视频这么火,在电视上看看短视频也不错。评测菌八卦之心雄起,搜索“最近的娱乐新闻”,长虹与TCL电视都是有不少短视频新闻资源的,不过创维和小米就没有这方面的资源了,这考察的完全是资源形式的丰富程度。
长虹:
TCL:
四、图像识别
图像识别,顾名思义,就是对电视内容中的图像进行识别,常见的有对人脸、花草、书籍、建筑等的识别。想想看,当你和朋友一起看热播剧,但小鲜肉太多,认不过来,就可以直接问电视“这人是谁”。
长虹:
创维:
TCL:
小米:
评测菌选用了同一部热播剧《归去来》的同一个场景,四款电视都可以识别,长虹与TCL还贴心推荐了相关影视资源。在其他播放内容中,长虹还可以实现多人识别。不过必须要说,图像识别的整体反馈速度要比语音识别慢上不少,小米电视更是最慢的那个。如果说流畅度很低,那这个功能的体验就很鸡肋了。
五、体育百科
大家都知道,除了影视资源外,电视资源里来头最大的应该要数体育资源了,有人买电视专门为了看球赛,因为其重要性,评测菌单独拉出来进行了对比。评测菌这里教大家如何在对体育一无所知的情况下还能和朋友侃侃而谈。
可以问问电视一些知名的体育明星是谁,还可以问问一些赛场上的专业词汇,比如啥是越位,“狼王”是谁?还有“今年世界杯什么时候开始”之类的。
长虹:
(上图仅做界面展示,不表示搜索速度)
创维:
(上图仅做界面展示,不表示搜索速度)
TCL:
小米:
对比四款电视,长虹对以上问题回答都很全面,并以卡片形式来介绍,其他三款电视要么体育资源不够,要么回答不来深度的百科问题。
六、总结
从智能语音的交互界面到语音识别、图像识别、知识图谱等技术能力,再到音乐、短视频、体育百科这样的内容,通过对比,长虹电视所搭载的腾讯叮当确实要略胜一筹。不吹不黑,目前智能语音业内的识别度达不到100%是行业通病,腾讯叮当也不能幸免,而且评测菌这里只用了普通话作为对比,真实的家庭环境中,口音还有小孩老人的吐词不清都会成为识别的障碍,智能语音还有很长一段路要走。
这次智能语音对比,评测菌有个很大感触,我们说智能语音,其实技术能力是一方面,但内容也是很重要的一方面。
智能电视作为仅次于智能手机渗透率最高的智能家电单品,并长期处于客厅的核心地位,智能语音以智能电视为承载的智能家居拥有相当广阔的未来,我们期待更“智能”的智能电视出现在客厅。