【免费】基于词矢量相似度的短文本分类-发表之家

基于词矢量相似度的短文本分类

作者：马成龙姜亚松李艳玲张艳颜永红中国科学院声学研究所北京100190

短文本分类词矢量相似度集外词

摘要：互联网中出现的短文本内容短小，相互共享的词汇较少，因此在分类过程中容易出现大量的集外词，导致分类性能降低。鉴于此，提出了一种基于词矢量相似度的分类方法，首先利用无监督的方法对无标注数据进行训练得到词矢量，然后通过词矢量之间的相似度对测试集中出现的集外词进行扩展。通过与基线系统的对比表明，该方法的分类正确率均优于基线系统1％-2％，尤其是在训练数据较少的情况下，所提出的方法的正确率相对提高10％以上。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询免费咨询杂志订阅

热门期刊服务

科技与经济统计与经济计算机教育计算机与信息技术数值计算与计算机应用计算机工程与设计计算机技术与发展计算机辅助设计与制造电气技术与经济机械科学与技术审计与经济研究制造技术与机床

基于大概念的语文教学基于智慧课堂的教与学基于核心素养的培养基于核心素养的教学方式基于模型的优化设计

山东大学学报·理学版

影响因子：0.49

期刊级别：北大期刊

发行周期：月刊

服务介绍

基于词矢量相似度的短文本分类

山东大学学报·理学版

期刊咨询

订阅杂志

期刊推荐