针对水利水电工程测量项目中测绘资料应用与管理的矛盾,基于Lucene全文检索引擎,利用Preparators插件技术,开发了更新方便、查询简单、管理便捷、性能高效的测绘资料信息管理系统,有效实现了测绘资料从采集处理到查询管理整个流程的制度化和智能化。
作者:赵广 期刊:《云南民族大学学报·自然科学版》 2019年第06期
Lucene是一个优秀的全文检索框架,布尔查询是其实现精准数据检索的重要功能.对于布尔查询执行计划的深入研究,有利于灵活应用布尔查询,优化查询表达式,提高执行效率.本文从Lucene架构下布尔查询的执行计划入手,研究了布尔查询的表示方式、执行时序、逻辑运算规则和子查询归并算法.根据布尔查询的执行计划,提出了深度为2的复杂布尔查询的化简规律和布尔逻辑运算满足交换律的特性,并从理论上证明它们的正确性.最后通过实验模拟仿真,...
作者:江婷; 谈国栋 期刊:《华中师范大学研究生学报》 2011年第01期
传统电子词典的查找方式是以词目为中心进行查找,这种方式使得各词条只具有从词目到词条内容的单向关联,而缺乏从词条内容到词目的反向关联,其结果是原本相互关联的知识被人为地割裂开来。基于Lucene文本搜索引擎架构和Eclipse Rich Client Platform技术开发的基于语料库的动态语用电子词典(CORD)克服了以上缺点,实现了词条的词目和词条内容的双向查找,使词典库的信息得到充分有效的利用。同时,其在英语教学中的应用也显示出了特有...
作者:卢盛祺; 何施晶; 韩景倜 期刊:《信息技术与网络安全》 2015年第18期
地址匹配技术常常被用于对属性地址信息快速定位,也是解决目前GIS系统分析能力瓶颈的重要方法。首先分析了中文地址匹配技术应用的现状以及常用地址匹配方法的优缺点,在此基础上给出了基于全文检索技术的地址匹配方法,并使用参考规则进行匹配结果优化,随后使用实验证明了方法的准确性。
作者:张贝克; 焦迪楠; 马昕; 李晶晶 期刊:《信息技术与网络安全》 2011年第08期
针对目前学习平台中信息简单罗列、组织层次不清晰的问题,利用.net平台上的ASP.Net、Silver Light技术设计实现了一个B/S架构的知识网络系统。分析了树形结构的特点,提出了递归寻路径法,将知识信息层次清晰地展现给用户,并实现节点间路径的获取。通过对Lucene.Net全文检索技术的研究,将其与SQL Server数据库的索引技术相结合,实现了一个高效的检索引擎。
作者:彭焕峰 期刊:《信息技术与网络安全》 2011年第18期
针对Lucene自带中文分词器分词效果差的缺点,在分析现有分词词典机制的基础上,设计了基于全哈希整词二分算法的分词器,并集成到Lucene中,算法通过对整词进行哈希,减少词条匹配次数,提高分词效率。该分词器词典文件维护方便,可以根据不同应用的要求进行定制,从而提高了检索效率。
作者:朱雪莲 期刊:《信息技术与网络安全》 2010年第22期
Lucene是一个强大的全文索引引擎工具包,它的全文检索技术是信息检索领域广泛使用的基本技术,具有访问索引时间快、多用户访问、跨平台使用的特点。介绍了一个高性能的全文检索引擎——Lucene开源系统,详细分析了Lucene的系统结构、全文索引机制,然后将其引入具体应用,给出了一个基于Lucene全文检索技术的具体实例。
作者:朱雪莲 期刊:《新疆教育学院学报》 2010年第02期
文章概述主题搜索引擎原理,介绍了高性能的全文检索引擎—Lucene开源系统,在分析Lucene语言分析器结构的基础上,得出基于Lucene的数码产品搜索引擎的主题词典的具体构建方法,并针对词典的更新做了初步探讨,总结了基于用户查询日志的主题词典构建方法。
作者:陈庆伟; 刘军 期刊:《图书情报导刊》 2005年第15期
Lucene是一个基于Java技术的开放源代码全文索引引擎工具包,它可以方便地嵌入到各种应用中实现针对应用的全文索引/检索功能.利用Lucene的API可以比较方便地为一个网站提供全文搜索功能.探讨了如何使用Lucene建造一个通用的Web站点全文搜索工具,并对在构建系统中应注意的若干问题进行了探讨.
随着网络信息资源的爆炸式增长,搜索引擎信息收集的集中式存储已无法满足需求。而扩展到分布式环境的信息如何快速定位成为了新的难题,本文详细介绍了如何使用开源软件库Lucene以及RM(I远程方法调用)技术建立分布式环境下的新型索引。
讨论了应用Lucene建立站点内信息全文检索系统需要注意的若干关键技术,概要介绍了Lucene全文索引工具包的索引结构与功能特点,进而从实际开发的角度,给出了简单实例,旨在为电子商务系统开发人员提供参考。
随着互联网信息量呈现指数级增长,人们希望搜索引擎能够把用户最关心的信息排在前面以方便浏览。本文提出了一种基于分类特征选择的信息检索结果重排序方法,将分类特征与其它检索特征融合在一起,在保持分类搜索引擎结果文档召回率的前提下,该方法有效地提高了检索结果的平均准确率。
作者:杨晓军; 王一莉 期刊:《煤炭技术》 2010年第06期
相对于全文检索工具包Lucene,Compass是一个开源的、高性能的、可灵活配置的搜索引擎框架。在分析了Compass的技术基础之上,提出了1种基于Compass的FTP全文检索系统结构,讨论了系统实现的关键技术。由于Compass是由JAVA开源实现的,因此把它与轻量级的J2EE框架结合起来,增强系统的解耦性,提高应用的可扩展性,降低系统重构的成本,同时也具有可移植行。
作者:卢凤 期刊:《内蒙古科技大学学报》 2018年第03期
机器翻译中的分词部分对于语料预处理过程有着至关重要的作用.而在蒙文分词中传统方法对于特征提取、构型特点的计算分析能力有限,基于Lucene的蒙文分词技术结合垂直搜索引擎技术,面向专业领域构建个性化专业词典,采用逐字二分的分词词典机制,并在此基础上采用正向最大匹配分词算法来改进Lucene的蒙文分词模块.文章提出了根据领域知识、领域概念、领域术语,在分词预处理前降低搜索噪音、信息过载、信息冗余等现象,从而改进了词典机...
作者:张绍琳; 曹平 期刊:《航空标准化与质量》 2019年第05期
围绕全文检索技术及其在标准信息系统中的应用展开了研究开发。研究了全文检索的原理,重点研究了主流的全文搜索引擎Lucene的实现方式,提出了基于文件系统的标准全文检索的解决方案。并在标准管理信息系统的基础上,开发了实现标准全文检索的站内搜索引擎系统,对标准的查找、实施和推广起到了积极的推动作用。
作者:邓晓枫; 蒋廷耀 期刊:《信息通信》 2017年第09期
Lucene开放源代码的特性让很多人使用它来构建具体的全文检索应用,然而对于中文检索来说,Lucene自带的中文分词器对中文的分词处理并不理想,其分词的正确率和分词速度以及对歧义词处理等方面不能满足大多数应用的需求,因此有必要为Lucene引入第三方分词器来弥补自带分词功能的缺陷。文章对采用mmseg算法的2种分词器mmseg4j和Jcseg在分词指标、索引创建的时间消耗方面进行测试比较,评估分析测试结果,结合应用场景为Lucene选择一个合...
作者:郭一平; 向晖; 王亮 期刊:《高校图书情报论坛》 2005年第04期
Ftp服务器是因特网最主要的服务器之一,其搜索引擎为人们使用Ftp服务提供了很大的方便.基于Lucene而设计的Ftp搜索引擎将会为用户提供更多更好的服务。本文主要论述了设计基于Lucene的Ftp搜索引擎的详细流程。
阿里的各项业务都对搜索服务有着刚性需求,这便对搜索引擎系统的稳定性和高效响应能力提出了很高的要求。本文结合阿里的业务特点,分析了搜索引擎系统所面临的挑战,并与业内的实时解决方案相比较,给出了能满足各业务线需求的实时搜索引擎系统的实现细节。
生活中,可能所有人都间接用过他的作品,他是Lucene、Nutch、Hadoop等项目的发起人。是他,把高深莫测的搜索技术形成产品,贡献给普罗大众;还是他,打造了目前在云计算和大数据领域里如日中天的Hadoop。他是某种意义上的盗火者,他就是DougCutting。