首页 期刊 计算机应用研究 基于有效上下文信息的变体词还原方法 【正文】

基于有效上下文信息的变体词还原方法

作者:游绩榕; 沙灜; 梁棋; 王斌 中国科学院信息工程研究所第二研究室; 北京100093; 中国科学院大学网络空间安全学院; 北京100049
变体词   变体词还原   自编码器   有效上下文信息   词嵌入  

摘要:在社交网络上,用户常创造一些变体词来替代部分实体名词,将这些变体词还原为原目标词是自然语言处理中的一项重要工作。针对现有变体词还原方法准确率不够高的问题,提出了基于有效上下文信息的变体词还原方法。该方法利用点互信息抽取出变体词和候选目标词的有效上下文信息,并将其融合进自编码器模型中,获得变体词和候选目标词更准确的编码,并依据此计算相似度进行候选目标词排序,更准确地实现了变体词还原任务。实验表明,该方法较当前主流的几种方法相比效果有显著提升,提高了变体词还原的准确率。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅