【免费】基于加权语义网的文本相似度计算方法研究-发表之家

基于加权语义网的文本相似度计算方法研究

作者：张弛; 周艳玲; 张贯虹合肥学院计算机科学与技术系; 安徽合肥230601

复杂网络特征词 knn算法文本相似度 hownet

摘要：为了更加准确地计算文本特征权重,提高文本相似度计算的精确度,文章提出了一种基于《知网(HowNet)》语义知识库的加权语义复杂网络文本相似度计算方法.该方法首先以特征词为节点,以特征词窗口共现为边,以特征词的TF-IDF值为特征词节点的初始权重,以融合共现频率和概念间语义距离计算特征词节点之间边的权重,构建加权语义文本复杂网络.然后利用综合特征指数作为加权语义网中文本的特征权重.最后基于公开数据集和KNN算法进行文本聚类实验,实验结果表明,在基于F-度量值标准上本文提出的方法要优于传统基于向量空间模型的TF-IDF方法和另一种结合复杂网络权重的方法.

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询免费咨询杂志订阅

热门期刊服务

科技与经济统计与经济计算机教育计算机与信息技术数值计算与计算机应用计算机工程与设计计算机技术与发展计算机辅助设计与制造电气技术与经济交通与计算机机械科学与技术审计与经济研究

基于大概念的语文教学基于智慧课堂的教与学基于核心素养的培养基于核心素养的教学方式基于模型的优化设计

赤峰学院学报·自然科学版

影响因子：0.4

期刊级别：省级期刊

发行周期：月刊

服务介绍

基于加权语义网的文本相似度计算方法研究

赤峰学院学报·自然科学版

期刊咨询

订阅杂志

期刊推荐