登录 | 注册

我要投稿

http://www.xinmeti.com智能硬件

智能硬件

·

阿里达摩院公布自研语音识别模型DFSMN并宣布开源

锌媒体报道 2018-06-07 10:59

近日，阿里巴巴达摩院机器智能实验室推出了新一代语音识别模型DFSMN，将全球语音识别准确率纪录提高至96.04%（这一数据测试基于世界最大的免费语音识别数据库LibriSpeech）。

达摩院机器智能实验室的语音识别团队主导了这个模型的研发，并宣布向全世界企业与个人开源。对比目前业界使用最为广泛的LSTM模型，DFSMN模型训练速度更快、识别准确率更高。采用全新DFSMN模型的智能音响或智能家居设备，相比前代技术深度学习训练速度提到了3倍，语音识别速度提高了2倍。

图：阿里在GitHub平台上开源了自主研发的DFSMN语音识别模型

在近期举行的云栖大会武汉峰会上，装有DFSMN语音识别模型的“AI收银员”在与真人店员的PK中，在嘈杂环境下准确识别了用户的语音点单，在短短49秒内点了34杯咖啡。此外，装备这一语音识别技术的自动售票机也已在上海地铁“上岗”。

著名语音识别专家，，西北工业大学教授谢磊表示：“阿里此次开源的DFSMN模型，在语音识别准确率上的稳定提升是突破性的。是近年来深度学习在语音识别领域最具代表性的成果之一。对全球学术界和AI技术应用都有巨大影响。”有业内人士称，DFSMN有望成为继传统的LSTM模型后，成为全球语音识别领域最主要的声学识别模型之一。

向作者提问

最新评论

游客

锌媒体报道

给我留言发送消息

Ta的文章(2723)更多

热门文章

办公桌上的健康“杀手”

IT观察

2016-11-21 21:39

乐歌人体工学亮相第十六届全国科技评价学术研讨会

IT观察

2016-11-02 11:04

站立办公成为新话题乐歌升降台登陆京东众筹

科技观察

2016-12-07 12:25

小鱼易连应用大赛圆满落幕重新定义视频应用

科技观察

2016-12-22 16:25

乐歌升降台拯救白领“久坐腿”的秘诀

科技观察

2017-01-03 16:21

推荐文章

瑞立视正式对外发布VR

人民网牵手北师大签署

VR游戏神秘首曝！网友

如何让中国6亿扇门装

盘点电子元器件涨价潮

谷歌超分辨率技术 RAISR ：模糊图片瞬变

无人机领域融资缩水风投为何遇冷了？

虚拟现实+医疗：一个美丽新世界的诞生？

人工智能将掌控人类命运吗？

外媒曝光iPhone7 Plus设计电路图

关于锌媒体 | 加入我们 | 商务合作 | 常见问题 | 网站地图