随着技术的发展,在原有的图形交互之上,越来越多的出现了语音交互,比如手机/PC上的语音助手,更进一步,还有很多人认为的未来智能家居hub中的智能音箱。
在语音交互中,语音识别是最基础、最专注的技能。
阿里巴巴达摩院机械智能实验室语音识别团队Keri推出了新一代语音识别模型——DFS Mn,不仅在论文中被Google等国外巨头引用,还将全球语音识别准确率纪录提升至96.04%(基于全球最大的免费语音识别数据库LibriSpeech)。
有哪些网站开发软件?详细说明了网站的开发和制作过程。
此外,团队还宣布即日起向全球企业和个人开放DFSMN模型,让全球开发者共享这一效果。
西北工业大学教授谢磊表示:“阿里开源的DFSMN模型在稳步提高语音识别准确率方面取得了突破。是近年来深度学习在语音识别领域最具代表性的效果之一。它对全球学术界和AI工艺应用产生了巨大的影响。”
阿里在GitHub平台上开发了自主研发的DFSMN语音识别模型。