首页 期刊 中文信息学报 多预测子融合实时连续语音识别输出词正误判别 【正文】

多预测子融合实时连续语音识别输出词正误判别

作者:付跃文; 杜利民 中国科学院声学研究所语音交互信息技术中心; 北京100080
计算机应用   中文信息处理   连续语音识别   预测子   决策树  

摘要:本文在采用堆栈译码词网重估输出作为识别最终输出的连续语音识别实时解码条件下,利用决策树方法将多个预测子融合,对识别输出词进行正确和错误的判别.本文首先构造了词后验概率、词长、相邻词的后验概率、词的声学和语言得分等共13个预测子,然后利用决策树方法,通过选择不同的预测子组合方式和适当的决策树建树参数,筛选出预测子的最佳组合,建立优化的决策树进行输出词的正误判别.实验结果表明:利用局域词图计算的词后验概率与词长、相邻词的后验概率等几种实时预测子融合后,对识别输出词的正误判别能力得到提高,并且在实时性和分类效果两个方面优于n-best输出的相应结果,相对于基线系统,则分类错误率下降41.4%.实验结果也表明本文提出的相邻词的后验概率是相对重要的预测子.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅