【免费】基于RNN和WFST译码的自动语音识别研究-发表之家

基于RNN和WFST译码的自动语音识别研究

作者：郑晓琼; 汪晓; 江海升; 樊培培; 张超国网安徽省电力有限公司检修分公司; 合肥230000

自动语音识别 eesen 递归神经网络加权有限状态换能器连接时间分类

摘要：文中利用Eesen框架声学建模简化了现有的自动语音识别(ASR),通过训练单个递归神经网络(RNN)来预测上下文无关的目标(音素或字符)。为了消除对预生成帧标签的需求,采用了连接时间分类(CTC)目标函数来推断语音和标签序列之间的对齐。同时,采用基于加权有限状态换能器(WFST)的广义译码方法,将词汇和语言模型有效地整合到CTC译码中。实验结果表明,与混合HMM/DNN模型相比,所提方法具有较低的误码率(WER),同时显著加快了译码速度。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询免费咨询杂志订阅

热门期刊服务

统计与经济科技与经济计算机教育计算机技术与发展计算机工程与设计计算机与信息技术数值计算与计算机应用科技与经济画报计算机与生活工业审计与会计机械设计与制造会计与经济研究

基于大概念的语文教学基于智慧课堂的教与学基于核心素养的培养基于核心素养的教学方式基于模型的优化设计

信息技术

影响因子：0.41

期刊级别：统计源期刊

发行周期：月刊

服务介绍

基于RNN和WFST译码的自动语音识别研究

信息技术

期刊咨询

订阅杂志

期刊推荐