首页 期刊 计算机与数字工程 基于Word2Vec的改进密度峰值新闻话题聚类 【正文】

基于Word2Vec的改进密度峰值新闻话题聚类

作者:高鑫; 徐建; 胡建洪 南京理工大学计算机科学与工程学院; 南京210094
word2vec   密度峰值聚类   新闻话题  

摘要:为了提高新闻话题聚类精度,论文提出一种基于Word2Vec的改进密度峰值聚类算法。首先基于Word2Vec提出一种新闻文本的向量表示方法,然后针对密度峰值聚类算法存在的问题,提出一种基于KNN改进的密度峰值聚类算法。该算法首先基于KNN计算样本的局部密度,然后通过最小二乘法线性拟合选取初始聚类中心并对剩余样本进行指派形成聚类结果。在搜狐新闻数据集上的实验结果验证了该算法的有效性。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅