首页 期刊 轻工学报 景区评论词频统计算法研究 【正文】

景区评论词频统计算法研究

作者:黄敏; 任宗华; 朱颢东 郑州轻工业学院计算机与通信工程学院; 河南郑州450001
词频   文本数据   景区评价   tfidf算法  

摘要:针对人们在出游前查看景区网络评价信息难以得到对该景区之整体评价的问题,提出了一种适用于海量数据的词频统计算法TF-CT.该算法采用余弦相似性算法对海量的文本数据进行词性分类,将具有相同表达态度的数据归为一类;采用TextRank算法对各类别中的一条数据进行关键词语提取;采用改进的TFIDF算法对提取的关键词进行词频统计,获取文本数据的表达态度.实验结果表明,与TFIDF算法相比,TF-CT算法在结果准确度和时间复杂度上具有更大的优势.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅