摘要:由于具有特征自学习性特性,LSTM被越来越多地应用在自然语言处理(NLP)中的命名实体识别(NER)领域,并取得较优的性能。本文提出一种新颖的词语-字符自适应混合编码算法,在已有的字符和词语信息的基础上,突破词语信息的局部性限制,基于语料库进行词语全局特征的提取与选择,并将此全局特征与局部特征(字符信息)进行叠加,帮助WC-LSTM捕获更多的文本特征。实际数据实验结果表明,与最新的WC-LSTM相比较,本文提出的自适应编码可以较为明显地提升LSTM在NER上的性能。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社