首页 期刊 深圳职业技术学院学报 一种适用于中文NER的自适应混合编码模型 【正文】

一种适用于中文NER的自适应混合编码模型

作者:刘凯洋 深圳职业技术学院人工智能学院; 广东深圳518055
nlp   ner   lstm   深度学习  

摘要:由于具有特征自学习性特性,LSTM被越来越多地应用在自然语言处理(NLP)中的命名实体识别(NER)领域,并取得较优的性能。本文提出一种新颖的词语-字符自适应混合编码算法,在已有的字符和词语信息的基础上,突破词语信息的局部性限制,基于语料库进行词语全局特征的提取与选择,并将此全局特征与局部特征(字符信息)进行叠加,帮助WC-LSTM捕获更多的文本特征。实际数据实验结果表明,与最新的WC-LSTM相比较,本文提出的自适应编码可以较为明显地提升LSTM在NER上的性能。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅