首页 期刊 计算机仿真 基于希尔伯特R树和LDA的混合机制研究 【正文】

基于希尔伯特R树和LDA的混合机制研究

作者:徐艺丹; 韩京宇 南京邮电大学计算机学院; 江苏南京210000; 南京邮电大学江苏省大数据安全与智能处理重点实验室; 江苏南京210000; 东南大学计算机网络和信息集成教育部重点实验室; 江苏南京210000
空间关键词   主题模型   混合索引   查询  

摘要:现有的空间关键词搜索方法通常采用以R树为主的混合索引,根据查询位置找到相关文本,查询时通过编辑距离或统计语言模型进行简单的文本匹配。然而多维R树的空间区域重叠率较高,且简单的文本匹配易造成语义相关的文本丢失。为了提高空间查询效率和文本匹配的准确率,构建了一种有效的混合索引结构希尔伯特信息检索树(Hilbert Retrieving information-Tree,HRI-Tree)并进行top-k查询,在Hilbert R树的节点中加入关键词的倒排索引,并采用LDA主题模型,通过主题分类更准确地查询到语义相关的文本,返回与查询文本近似匹配且空间距离相近的top-k结果。上述算法在实验中与当前的方法在查询所需时间、节点重叠覆盖率、文本匹配的准确率等方面进行了比较,显示出其优越的性能。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅