首页 期刊 软件学报 基于代码结构知识的软件文档语义搜索方法 【正文】

基于代码结构知识的软件文档语义搜索方法

作者:林泽琦; 邹艳珍; 赵俊峰; 曹英魁; 谢冰 高可信软件技术教育部重点实验室(北京大学); 北京100871; 北京大学信息科学技术学院; 北京100871; 北京大学(天津滨海)新一代信息技术研究院; 天津300450
软件复用   自然语言文本   代码结构知识   信息检索   语义搜索  

摘要:自然语言文本形式的文档是软件项目的重要组成部分.如何帮助开发者在大量文档中进行高效、准确的信息定位,是软件复用领域中的一个重要研究问题.提出了一种基于代码结构知识的软件文档语义搜索方法.该方法从软件项目的源代码中解析出代码结构图,并以此作为领域特定的知识来帮助机器理解自然语言文本的语义.这一语义信息与信息检索技术相结合,从而实现了对软件文档的语义检索.在StackOverflow问答文档数据集上的实验表明,与多种文本检索方法相比,该方法在平均准确率(mean average precision,简称MAP)上可以取得至少13.77%的提升.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅