【免费】借助音频数据的发音字典新词学习方法-发表之家

借助音频数据的发音字典新词学习方法

作者：范正光; 屈丹; 闫红刚; 张文林解放军信息工程大学信息系统工程学院; 郑州450002

语音识别发音字典新词学习集外词

摘要：针对已有的发音字典扩展方法只能从文本数据中学习新词而无法学习到音频数据中新词的问题,提出了一种基于混合语音识别系统的发音字典新词学习方法。该方法首先分别采用音节和字母音素对混合识别系统对音频数据进行集外词识别,利用系统间的互补性得到尽可能多的新词及其发音候选,然后借助感知器与最大熵模型对得到的新词及发音进行优化,降低错误率,最后实现发音字典的扩展,并利用语法语义信息完成对语言模型参数更新。基于华尔街日报（WSJ）语料库的连续语音识别实验表明：该方法可以有效学习到音频数据中的未知新词,采取的数据优化策略极大地提高了所得新词及发音的精度;在词错误率指标下,字典扩展后系统的识别性能相对基线系统提高约13.4%。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询免费咨询杂志订阅

热门期刊服务

建筑结构世界建筑建筑节能世界竹藤通讯建筑钢结构进展世界建筑导报建筑结构学报当代世界社会主义问题世界社会主义研究中国建筑金属结构当代世界与社会主义墙材革新与建筑节能

西安交通大学学报

影响因子：1.89

期刊级别：北大期刊

发行周期：月刊

服务介绍

借助音频数据的发音字典新词学习方法

西安交通大学学报

期刊咨询

订阅杂志

期刊推荐