导读:微软今天宣布,其会话语音识别系统的误率达到了5.1%,是目前为止最低的。
这一数据超过了微软人工智能和研究团队去年5.9%的误差率,并将其准确性与专业的人类转录者相提并论,后者拥有类似于听几次文本的能力。
两项研究都记录了总机语料库的录音,这是自上世纪90年代初以来,研究人员用来测试语音识别系统的约2,400个电话交谈的集合。
这项新研究是由微软人工智能和研究团队的一组研究人员完成的,目标是达到与一组人类转录者一样的准确度,他们能够听他们几次转录的内容,了解他们的谈话内容,并与其他转录员一起工作。
总的来说,最新研究的研究人员通过改进微软语音识别系统的神经网络声学和语言模型,将错误率降低了约12%。
值得注意的是,他们还让自己的语音识别器使用整个对话,让它根据上下文调整文本,预测接下来可能出现的单词或短语,就像人类在与他人交谈时所做的那样。
微软的语音识别系统用于Cortana、演示文稿翻译和微软认知服务等服务。
精彩导读
热门资讯
- IEEE通过802.11bb标准 Li-Fi技术正式规范化
- 华米Amazfit Cheetah/Pro手表渲染图曝光 配备圆形表盘
- 苹果Vision Pro摄像头不向第三方应用开放 以用户隐私为重
- 苹果Vision Pro头显电池曝光:4780毫安时,中国德赛制造
- 报告称Apple Watch去年销量5390万块 累计销量2.29亿块
- 消息称天猫精灵智能眼镜正测试大模型交互
- 苹果iPad新专利:配数字表冠,用于控制3D虚拟场景
- 苹果空间音频导航专利曝光 可通过改变声音位置等引导转向
- Canalys报告:2023年Q1全球智能音频设备出货量同比下降15%
- 苹果计划明年底在中国、日本等国家销售Vision Pro头显