首页 期刊 计算机研究与发展 结合GAN与BiLSTM-Attention-CRF的领域命名实体识别 【正文】

结合GAN与BiLSTM-Attention-CRF的领域命名实体识别

作者:张晗; 郭渊博; 李涛 战略支援部队信息工程大学密码工程学院; 郑州450001; 郑州大学软件学院; 郑州450001
领域命名实体识别   生成式对抗网络   众包标注数据   实体标注一致  

摘要:领域内命名实体识别通常面临领域内标注数据缺乏以及由于实体名称多样性导致的同一文档中实体标注不一致等问题.针对以上问题,利用生成式对抗网络(generative adversarial network, GAN)可以生成数据的特点,将生成式对抗网络与BiLSTM-Attention-CRF模型相结合.首先以BiLSTM-Attention作为生成式对抗网络的生成器模型,以CNN作为判别器模型,从众包标注数据集中整合出与专家标注数据分布一致的正样本标注数据来解决领域内标注数据缺乏的问题;然后通过在BiLSTM-Attention-CRF模型中引入文档层面的全局向量,计算每个单词与该全局向量的关系得出其新的特征表示以解决由于实体名称多样化造成的同一文档中实体标注不一致问题;最后,在基于信息安全领域众包标注数据集上的实验结果表明,该模型在各项指标上显著优于同类其他模型方法.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅