摘要:微博作为舆情分析中基础数据的主要来源之一,如何对其进行有效提取是数据获取的关键问题。为此,提出一种基于用户影响力的数据提取算法,以满足舆情系统对数据的需求。该算法首先利用模拟登录技术获取用户关系并依此构建用户网络,再根据自主设计的用户影响力计算方法计算出影响力,进而建立符合微博特征的影响力最大化模型挖掘出最具传播能力的k个节点,最后爬取相应的微博数据。实验证明,该算法能够有效提高获取数据的质量,为舆情分析提供更好的数据支持。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
热门期刊服务
相关文章
影响因子:0.61
期刊级别:北大期刊
发行周期:月刊
期刊在线咨询,1-3天快速下单!
查看更多>
超1000杂志,价格优惠,正版保障!
一站式期刊推荐服务,客服一对一跟踪服务!