首页 期刊 软件 基于MapReduce模型的并行单词贡献度算法的设计与实现 【正文】

基于MapReduce模型的并行单词贡献度算法的设计与实现

作者:彭超 北京邮电大学计算机学院 北京市100876
计算机软件与理论   mapreduce   单词贡献度算法   文本挖掘   特征选择  

摘要:Goo出在2004年提出了MapReduce框架,MapReduce支持海量数据的并行计算。单词贡献度算法是文本挖掘中一种比较新颖的用于非监督聚类的特征词提取算法。本文基于MapReduce框架设计并实现了一种并行的单词贡献度算法。通过对比试验可以得出结论,本文所提出的并行算法较普通的单词贡献度算法性能有大幅度提升。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅