作者:李庆华; 苏珊 期刊:《计算机工程》 2005年第05期
由于入侵检测使用的数据集十分庞大,现有的串行聚类算法很难在合理的时间内得到结果.文章提出了一种应用于入侵检测的并行K-均值算法,给出了其加速比估算公式,实验证明了算法的正确性和有效性.
作者:蒲洁珠 周晓 吴共庆 胡学钢 期刊:《计算机工程》 2010年第21期
针对客户端垃圾邮件过滤器难以获取足够训练样本的问题,提出一种基于小样本学习的垃圾邮件过滤方法,利用容易获取的未标记样本提高垃圾邮件过滤的性能。该方法使用已标记的小样本邮件实例集训练一个初始Naive Bayes分类器,以此标注未标记邮件,再使用所有数据训练新的分类器,利用EM算法进行迭代直至收敛。实验结果证明,当给定5个-20个已标记小样本训练邮件时,该方法可有效提高垃圾邮件过滤性能。