首页 期刊 应用科技 基于互信息的语言模型回退平滑算法 【正文】

基于互信息的语言模型回退平滑算法

作者:张磊 褚昆 郭黎利 哈尔滨工程大学信息与通信工程学院 黑龙江哈尔滨150001
中文信息处理   统计语言模型   平滑算法   互信息   困惑度  

摘要:针对二元模型,提出了一种基于互信息的回退(MI Back-off)平滑算法.从互信息的角度,分析词之间的搭配关系,根据模型中每个二元对的互信息对其概率进行不同程度的折扣,并利用低阶模型对零概率事件进行补偿,通过极小化困惑度的原则体现新算法的合理性.在不同类别测试集下,该平滑算法与传统Katz平滑算法相比,模型困惑度下降均超过20%。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅