首页 期刊 数据分析与知识发现 多媒体微博评论信息的主题发现算法研究 【正文】

多媒体微博评论信息的主题发现算法研究

作者:叶川; 马静 南京航空航天大学经济与管理学院; 南京211106
文本挖掘   多媒体   微博   lda   主题发现  

摘要:【目的】发现微博中图片或视频等多媒体内容的主题特征。【应用背景】多媒体微博的文本内容普遍简短且主题通常蕴含在图片或视频等多媒体内容中,传统的文本挖掘方法不适用于这种多媒体类微博。【方法】通过热点评论扩充该多媒体微博的文本空间,并使用LDA主题模型进行分类推断与主题特征挖掘,使用“主题标签一特征词”的形式表达微博多媒体内容的主题特征。【结果琐用爬虫工具采集的99823条新浪微博构建训练集,151条热门多媒体微博及其所有评论构建测试集进行实验,构建的分类目录中标签完善,主题标签推断准确率达到88.6%,相关特征词挖掘准确率为76.0%。【结论】实验结果表明本文的算法可以有效且显著地发现多媒体微博的主题特征。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅