作者:朱玲玉; 王旌舟; 陈庆春 期刊:《通信技术》 2018年第03期
高效、准确地对PDF文档文本内容中的敏感信息脱敏,成功的关键在于敏感词的有效匹配。因此,对经典单模式匹配BM算法、QS算法进行研究分析,结合PDF文本内容编码的规则,提出了一种适用于PDF文档的模式匹配算法。该算法利用BM算法的坏字符表的计算规则、QS算法的下一字符思想,结合已匹配的信息及PDF编码规则,使其最大跳跃距离为m+4,减少了匹配次数,提高了匹配效率。分析验证表明,该算法匹配效率相对于BM算法、QS算法有一定提高。
影响因子:1.87
期刊级别:省级期刊
发行周期:月刊
影响因子:1.44
期刊级别:CSSCI南大期刊
影响因子:0.44
发行周期:半月刊
影响因子:0.07
发行周期:旬刊
影响因子:0.65
期刊级别:北大期刊
影响因子:0.35