首页 期刊 计算机工程与应用 潜在语义分析在连续语音识别中的应用 【正文】

潜在语义分析在连续语音识别中的应用

作者:欧建林 林茜 史晓东 厦门大学计算机科学系 福建厦门361005
潜在语义分析   n元文法   k均值聚类   连续语音识别  

摘要:研究了潜在语义分析(LSA)理论及其在连续语音识别中应用的相关技术,在此基础上利用WSJ0文本语料库上构建L5A模型,并将其与3-gram模型进行插值组合,构建了包含语义信息的统计语言模型;同时为了进一步优化混合模型的性能,提出了基于密度函数初始化质心的k-means聚类算法对LSA模型的向量空间进行聚类。WSJ0语料库上的连续语音识别实验结果表明:LSA+3-gram混合模型能够使识别的词错误率相比较于标准的3-gram下降13.3%。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅