作者:陈悦; 董红斌; 谭成予; 梁意文 期刊:《上海大学学报·自然科学版》 2018年第05期
随着计算机的普及和大数据时代的来临,个人计算机中文档的版本数急剧增加,用户想要迅速找到所需的文档绝非易事.相关研究表明,文件的起源信息可以为用户提供快速定位目标文档的线索.已有的一些基于数据起源的检索方式,其起源粒度多数是文件级的.但对于内容相关性较高的文档来说,文件级的起源信息无法清晰地描述内容间的关联关系,也就无法给予用户充分的帮助.基于PROV模型,针对文档版本的变化建立内容级的起源概念模型,并给出了起源...
作者:严锐; 李石君 期刊:《计算机工程》 2018年第03期
传统的搜索引擎仅返回给用户包含查询关键字的文档,忽略了查询背后用户真正的信息需求。为此,将文档检索看作个性化推荐问题,提出一种查询意图识别的主题模型个性化检索算法。对用户检索历史进行潜在狄利克雷分布主题建模,结合检索历史主题模型识别用户查询的潜在意图,并按主题相关度进行文档推荐,计算查询到文档集的KL距离对文档集排序,最终返回给用户个性化检索文档列表。实验结果表明,与基于协同相似计算和基于用户聚类...
作者:王亮 期刊:《自动化与仪器仪表》 2017年第09期
针对目前工程项目管理的信息化需求,提出一种基于工作流技术的工程项目管理系统。为实现该系统,文章首先结合工程项目管理的相关业务,利用UML建模工具,对系统的用例进行分析;其次,在上述用例分析的基础上,提出本文设计的目标,并对系统的整体架构、整体运行的工作流引擎、具体功能模块进行设计;最后,根据上述的设计要求,对项目合同管理模块、项目进度管理、项目文档检索等进行了详细的设计和实现,并提出通过各类完成对...
作者:凌晔华; 庞抗; 张晓洁; 郑鑫 期刊:《智能计算机与应用》 2017年第03期
针对当前企业对文档保密与检索功能的双重需求,提出一种添加模糊匹配Hubble.Net保密文档专用检索阅读方法。采用AES(Advanced Encryption Standard)加密算法对将加密文档提取的流信息流进行加密,使用Hubble.Net与对加密文档进行检索时,而模糊匹配算法的使用大大增加了字符比对的容错性,在保证文档加密的同时兼顾了文档位置定位、关键字定位等文档检索功能。在检索速度及精度方面,要优于现有的方法。
作者:陈勇; 张佳骥; 戎纪光 期刊:《无线电工程》 2007年第02期
随着电子文本信息在机构内部的快速增加,人们无法应对堆积如山的文档,许多文档无法实现其信息价值,如何充分利用这些文本信息资源已成为一个迫切需要解决的问题。介绍一种可用于机构内部的智能文本分析系统以及相关的关键技术,其功能包括文档检索、文档自动摘要和话题自动识别与跟踪。利用智能文本分析系统能够充分实现文本文档的信息价值。
Dublin Core元数据在文档描述中被广泛使用。文章首先对Dublin Core元数据进行简短介绍,然后阐述对数字文档进行检索的几种方法,最后通过实例比较这几种方法在基于Dublin Core元数据的文档检索中的效率。
作者:贾西平 刘海珠 期刊:《广东技术师范学院学报》 2010年第03期
现有文档检索软件大多存在功能耦合过于紧密、软件难以重用、可扩展性不好等问题:提出了一种面向服务的文档智能检索平台SODIRP(Servjce Oriented Document Intelligent Retrieval Platform),包括DR(Document Retrieval)应用、DR服务和DR服务三部分;DR服务的引入实现了DR应用和DR服务的松散耦合,较好的支持了DR软件的重用和扩展。
作者:何海江 龙跃进 期刊:《计算机应用》 2011年第11期
针对标记训练集不足的问题,提出了一种协同训练的多样本排序学习算法,从无标签数据挖掘隐含的排序信息。算法使用了两类多样本排序学习机,从当前已有的标记数据集分别构造两个不同的排序函数。相应地,每一个无标签查询都有两个不同的文档排列,由似然损失来计算这两个排列的相似性,为那些文档排列相似度低的查询贴上标签,使两个多样本排序学习机新增了训练数据。在排序学习公开数据集LETOR上的实验结果证实,协同训练的排序算法很有...
英国格拉斯哥大学近期消息称,该校科学家通过使用现场可编程逻辑门阵列(FPGA)芯片系统,能够以高出目前标准处理器20倍的速度完成文档检索,可大幅降低使用网络搜索的碳排放量,从而向构建“绿色节能网络”又迈进一步。
由汉王科技公司推出的全球首款手写电纸书日前亮相北京科博会。据汉王科技介绍,这款产品预装了两干册正版图书,是具有全屏手写批注、记事以及文档检索、声乐录放等功能的电子阅读终端设备。
作者:文辉 王明文 吴水秀 万剑怡 期刊:《计算机应用与软件》 2012年第08期
快速相似性检索技术对于各种信息检索应用都具有很大的意义,其中基于语义哈希的快速相似性检索即是一个合理有效的检索方式,其检索模型能够在保证语义相关的基础上将高维空间中大量相关的文档数据,映射在低维空间中。虽然近年来许多关于语义哈希的研究都表现了不错的实验结果,但是都没有考虑到利用文档集合自身的信息来加强文档间的相关信息。为了有效利用文档自身信息,提出结合强化文档间邻接关系的马尔可夫迁移过程及使用保留局...