首页 期刊 计算机科学 PFTM:一种基于投影的频繁子树挖掘算法 【正文】

PFTM:一种基于投影的频繁子树挖掘算法

作者:杨沛; 郑启伦; 彭宏; 李颖基 华南理工大学计算机科学与工程学院; 广州; 510640
挖掘算法   可扩展   投影   xml文档   web挖掘  

摘要:频繁子树在Web挖掘、XML文档分析、生物信息处理等领域有着重要的应用.提出了一种新的基于投影的频繁子树挖掘算法(PFTM),通过对数据库和候选节点集进行投影,并采用递推式候选节点集更新技术来有效地压缩搜索空间,以高效地从森林中挖掘出频繁子树.PFTM不需要产生候选子树.性能对比实验表明,PFTM是有效和可扩展的,而在算法效率上,PFTM要比FREQT平均高出40%左右.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅