首页 期刊 信息系统工程 基于编辑距离和同义词词林的中文百科知识库三元组降噪方法研究 【正文】

基于编辑距离和同义词词林的中文百科知识库三元组降噪方法研究

作者:谷函哲; 王汀; 高静; 刘经纬 首都经济贸易大学
知识库   编辑距离   同义词词林   相似度计算  

摘要:知识库的提出为当下互联网社会中日益增长的数据的存储提供了良好的解决方案。近年来,英语领域的语义知识库自动化构建工作稳步发展,中文关联数据网的构建还未开发出成熟的体系。国内的互动百科和百度百科由于分词规则、数据融合技术等原因和当下自由开放式收集编纂百科词条的方式,用户在标注词条分类及编辑信息框时有很大的自由性,导致词条信息的不准确、不一致和冗余。论文提出一种基于编辑距离和同义词词林知识库结合的高效计算相似度的算法,该算法对规模较大的百科知识库三元组具有精炼和去噪效果。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅