首页 期刊 计算机工程 语音检索中子词单元的构建算法 【正文】

语音检索中子词单元的构建算法

作者:杨乐 吴及 吕萍 清华大学电子工程系 北京100084
集外词   语音检索   子词   最小描述长度   最大互信息  

摘要:针对语音关键词检索中的集外词问题,提出基于最大互信息-最小描述长度(MMI-MDL)的子词集构建算法。根据子词对的互信息挑选聚合对,通过MDL准则判断是否聚合成新的子词。使用该子词集把单词映射成子词的组合用于检索。实验结果表明,与已有的MDL子词集构建算法相比,由MMI-MDL方法得到的子词集对检索性能有较大提高,在相同精确率指标下,集外词的召回率相对MDL算法提高12.1%。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅