首页 期刊 信息技术与网络安全 基于Lucene搜索引擎的涉恐信息检索模块设计与实现 【正文】

基于Lucene搜索引擎的涉恐信息检索模块设计与实现

作者:彭世亮; 周欣; 卿粼波; 熊淑华; 何小海 四川大学电子信息学院; 四川成都610065; 中国信息安全测评中心; 北京100085
lucene   搜索引擎   分词   涉恐  

摘要:互联网中存在大量涉恐信息,加强对这些信息的组织与利用,在防恐、反恐中起着重要的作用。针对网络涉恐信息零散情况,通过网络爬虫技术收集互联网上的涉恐信息,构建涉恐信息数据库;在此基础上,引入中文分词器进行合理粒度分词,使用Lucene构建全文搜索引擎以提升检索效率。同时,在建立索引时根据文档包含涉恐信息特征词汇的数量改变权重,查询时包含多特征词汇的涉恐信息排序更靠前。系统采用Python进行信息采集和数据结构化,使用MySQL构建涉恐信息数据库,通过Lucene构建全文检索引擎,测试表明,该引擎能够快速、准确地完成信息检索。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅