【免费】一种改进的基于记忆的自适应汉语语言模型-发表之家

一种改进的基于记忆的自适应汉语语言模型

作者：张俊林; 孙乐; 孙玉芳中国科学院软件研究所; 系统软件与中文信息中心; 北京; 100080

人工智能自然语言处理语言模型自适应同义词词林

摘要：基于记忆的自适应语言模型虽然在一定程度上增强了语言模型对不同领域的适应性,但其假设过于简单,即认为一个在文章的前面部分出现过的词往往会在后面重复出现.通过对一些文本的观察分析,我们认为作者在书写文章的时候,除了常常使用前文中出现过的词汇外,为了避免用词单调,还会在行文过程中使用前文出现过词汇的近义词或者同义词.另外,一篇文章总是围绕某个主题展开,所以在文章中出现的许多词汇往往在语义上有很大的相关性.我们对基于记忆的语言模型进行了扩展,利用汉语义类词典,将与缓存中所保留词汇语义上相近或者相关的词汇也引入缓存.实验表明这种改进在很大程度上提高了原有模型的性能,与n元语言模型相比困惑度下降了40.1%,有效地增强了语言模型的自适应性.

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询免费咨询杂志订阅

热门期刊服务

中兽医医药中华转移性肿瘤中华医学遗传学中医中国仪器仪表中国疫苗和免疫中国翻译四川中医湖南中医中医研究河北中医云南中医

中文信息学报

影响因子：0.84

期刊级别：北大期刊

发行周期：月刊

服务介绍

一种改进的基于记忆的自适应汉语语言模型

中文信息学报

期刊咨询

订阅杂志

期刊推荐