首页 期刊 信息技术 基于K-means算法改进的短文本聚类研究与实现 【正文】

基于K-means算法改进的短文本聚类研究与实现

作者:王俊丰; 贾晓霞; 李志强 华北计算技术研究所; 北京100083
短文本   聚类   无监督  

摘要:文中讨论在文本类目数未知的情况下,如何对数据量过少的短文本进行有效聚类的问题。短文本的特点是每一份样本文章数据少,数据稀疏,用常规的聚类方法进行文本聚类不能取得很好的效果。文中提出了一种基于K-means的改进算法,提出一种简单降维方式和新的判别样本点距离的方法,经实验验证,文中改进算法比原K-means算法有更高的准确性。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅