首页 期刊 电信科学 特征词选择与相似度融合的微博话题发现方法 【正文】

特征词选择与相似度融合的微博话题发现方法

作者:陈红阳; 汪林林; 陈滢生; 鲁江坤; 左雪 重庆人文科技学院计算机工程学院; 重庆401524
微博   特征词   选择   相似度   话题发现  

摘要:微博短文本中存在一些相同或相近、但与主题关系不大的词项,对准确度量文本之间的相似性具有较大的干扰作用,影响微博话题被发现的质量。提出一种基于文本内容与结构化信息相结合的特征词选择算法,能有效提取具有代表性的特征词,并对文本、话题间相似度的计算策略进行改进,然后将特征词选择算法与相似度计算方法融合,应用于微博文本数据实现话题发现。实验结果表明,本算法能有效降低话题发现的平均漏检率与误检率,提高话题发现质量。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅