首页 期刊 农业机械学报 基于农业网络信息分类的热词自动提取方法 【正文】

基于农业网络信息分类的热词自动提取方法

作者:段青玲; 张璐; 刘怡然; 王沙沙 中国农业大学信息与电气工程学院; 北京100083; 北京农信通科技有限责任公司; 北京100081
农业网络信息   农业舆情监测   热词   多标记分类   热度计算  

摘要:热词提取对于监控和分析农业舆情具有重要意义,目前已有一定研究基础,但仍存在针对性差等问题,无法满足农业领域不同产业用户群的个性化需求,为此,提出一种基于农业网络信息分类的热词自动提取方法。首先采用多标记分类算法对文本语料进行分类,按分类类别构建语料库,然后采用基于信息熵的方法对每个类别分别提取热词候选词,最后采用基于时间变化的方法进行候选词热度计算,根据候选词热度排序结果得到热词。本文抽取农业网站上的15 354条文本进行实验,结果表明,热词提取准确率达到0.9以上,能够较高质量地提取农业热词,为不同农业用户群体发现和分析产业热点提供帮助。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅