【免费】数据起源在多版本文档检索中的应用-发表之家

数据起源在多版本文档检索中的应用

作者：陈悦; 董红斌; 谭成予; 梁意文武汉大学计算机学院; 武汉430072; 武汉大学国际软件学院; 武汉430079

多版本文档文档检索数据起源 prov模型

摘要：随着计算机的普及和大数据时代的来临,个人计算机中文档的版本数急剧增加,用户想要迅速找到所需的文档绝非易事.相关研究表明,文件的起源信息可以为用户提供快速定位目标文档的线索.已有的一些基于数据起源的检索方式,其起源粒度多数是文件级的.但对于内容相关性较高的文档来说,文件级的起源信息无法清晰地描述内容间的关联关系,也就无法给予用户充分的帮助.基于PROV模型,针对文档版本的变化建立内容级的起源概念模型,并给出了起源词汇表.在资源描述框架(resource description framework,RDF)语言的基础上建立了起源信息的查询访问机制,并给出了可视化方案,为用户提供直观的信息表达.结果表明,该方法通过对文档检索结果的扩展和解释,可以为用户提供更有价值的帮助信息,从而达到快速锁定目标文件的目的,提高工作效率.

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询免费咨询杂志订阅

热门期刊服务

数据大数据大数据时代数据通信电力大数据文献与数据学报中国数据通信数据采集与处理网络安全与数据治理模具技术工具技术戏剧艺术

数据专员工作总结数据专员述职报告数据交换技术论文数据保密解决方案数据信息论文数据分析分析技术数据分析实训总结数据分析师统计学基础数据分析方法数据分析毕业论文数据分析的前景数据分析的方法

上海大学学报·自然科学版

影响因子：0.94

期刊级别：北大期刊

发行周期：双月刊

服务介绍

数据起源在多版本文档检索中的应用

上海大学学报·自然科学版

期刊咨询

订阅杂志

期刊推荐