首页 期刊 地球信息科学学报 基于通用知识库的地理实体开放关系过滤方法 【正文】

基于通用知识库的地理实体开放关系过滤方法

作者:高嘉良; 余丽; 仇培元; 陆锋 中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室; 北京100101; 中国科学院大学; 北京100049; 中国科学院文献情报中心; 北京100190; 江苏省地理信息资源开发与利用协同创新中心; 南京210023
文本数据   地理实体关系抽取   地理知识图谱构建   通用知识库   开放关系抽取  

摘要:文本数据为地理知识服务提供了海量资源。面向文本数据的地理实体关系抽取是地理知识图谱构建的核心技术,直接影响地理知识推理与服务的质量。由于文本数据不可避免地含有噪声,从文本中抽取的地理实体关系需要质量评价和信息过滤。本文提出一种基于通用知识库的地理实体关系过滤方法,针对已抽取的地理实体关系从中筛选出高质量的结果:先利用"本体知识"、"事实知识"和"同义词知识"构建地理关系知识库,作为信息过滤的参照数据;再基于分布式向量表示模型度量已抽取的地理实体关系与参照数据之间的语义相似性,以提高地理知识图谱的丰度与鲜度。实验结果表明,相比业界流行的"Stanford OpenIE"工具,本文所提出的方法可将置信度区间[0, 0.2]和[0.8, 1]的MSE(Mean Square Error)从59.27%降至3.94%,AUC(Area Under the ROC Curve)从0.51提升至0.89。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅