【免费】计算文本相似度的方法体系与应用分析-发表之家

计算文本相似度的方法体系与应用分析

作者：黄文彬; 车尚锟北京大学信息管理系; 北京100871

文本挖掘文本相似度分类体系语义信息应用

摘要：[目的/意义]文本间的相似度是信息检索、文档检测和文本挖掘等任务核心参考的指标之一。梳理现有计算文本相似度的方法、分类体系及应用,有助于研究人员选择合适的计算方法提高特定场景应用的性能。[方法/过程]文章将算法利用文本语义信息的程度、基础语义信息类型、模型类型以及关联关系类型作为划分依据构建方法体系,并从原理和应用上梳理算法间的异同。[结果/结论]将文本相似度计算方法分为无语义信息、基于浅层语义信息、基于深层语义信息三个大类,对参考的语义信息、算法的基本原理和该类的典型应用做了探索分析。[创新/价值]使文本相似度计算方法具有更清晰和完整的体系,使研究人员能更好地区分相似度计算方法间的计算需求与应用场景的差异。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询免费咨询杂志订阅

热门期刊服务

计算机航空计算技术现代计算机计算物理计算机学报数值计算与计算机应用计算数学计算机仿真计算机与生活心智与计算计算机科学计算机与农业

计算化学论文计算器总结计算教学论文计算方法论文计算机word论文计算机与科学技术学科评估计算机与网络安全计算机与网络论文计算机与设计论文计算机专业专业论文计算机专业学术论文计算机专业导论论文

情报理论与实践

影响因子：2.76

期刊级别：CSSCI南大期刊

发行周期：月刊

服务介绍

计算文本相似度的方法体系与应用分析

情报理论与实践

期刊咨询

订阅杂志

期刊推荐