首页 期刊 计算机科学 基于后缀树的二进制可执行代码的克隆检测算法 【正文】

基于后缀树的二进制可执行代码的克隆检测算法

作者:张凌浩; 桂盛霖; 穆逢君; 王胜 国网四川省电力公司电力科学研究院; 成都610000; 电子科技大学计算机科学与工程学院; 成都611731; 中国电子科技集团公司第三十研究所; 成都610041
代码克隆   二进制可执行文件   后缀树   性能优化  

摘要:如何发现代码克隆,是软件维护和软件侵权纠纷案件中的一个关键问题。由于商业保密等原因,在商业软件的侵权纠纷案中往往无法使用基于源代码比对的克隆检测技术。因此,针对这类无法获得源代码进行代码克隆检测的场景,文中提出一种针对二进制可执行文件分析的代码克隆检测方法。首先,通过反编译与指令类型抽象得到二进制可执行目标文件的指令类型序列;然后,对指令类型序列构建后缀树,利用后缀树的性质获取函数级的指令序列间的克隆信息,并通过消除沙砾指令进一步提高检测性能;最后,基于MIPS32指令集,使用Linux内核和经过混淆处理的代码分别作为克隆级别0-级别2与级别1-级别4的二进制可执行文件代码克隆测试样本,并与源代码检测工具进行对比测试。结果表明,所提算法在缺少源代码的场景下同样能进行细粒度的克隆分析,且对各级代码克隆均具有较好的检测性能。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅