作者:厉柏伸; 李领治; 孙涌; 朱艳琴 期刊:《计算机科学》 2018年第04期
结合TF-IDF算法思想,提出了特征频率、森林频率以及伪梯度提升决策树,解决了梯度提升决策树随着迭代次数的增加,错误数据被边缘化的问题。在伪梯度提升决策树中,所有决策树分别在原始数据集的Bootstrapping后的数据集上产生,无须针对每次迭代来对数据集采样。在分布式集群上进行内网防御的实验,结果表明在一定规模的训练集上,伪梯度提升决策树具有更好的预测准确度。
影响因子:1.87
期刊级别:省级期刊
发行周期:月刊
影响因子:1.44
期刊级别:CSSCI南大期刊
影响因子:0.44
发行周期:半月刊
影响因子:0.07
发行周期:旬刊
影响因子:0.65
期刊级别:北大期刊
影响因子:0.35