首页 期刊 科技广场 Web使用挖掘数据预处理中的一种会话识别改进算法 【正文】

Web使用挖掘数据预处理中的一种会话识别改进算法

作者:周青 姚力文 黄龙军 肖燕 南昌大学信息工程学院计算机系 江西南昌330031 江西师范大学软件学院 江西南昌330000 江西省经济管理干部学院 江西南昌330031
访问模式挖掘   数据预处理   会话识别   阈值   网站结构  

摘要:本文论述了Web用户访问模式挖掘中的数据预处理,主要提出了数据预处理中如何识别会话的一种改进算法。该方法通过使用三个因素来构造会话:①根据先验知识,确定会话时间阈值识别会话;②根据页面访问时间统计分布,确定相邻网页访问时间间隔阈值识别会话;③页面内容及站点结构确定页面重要程度识别会话。实验结果表明,相对于传统的单一方法进行会话识别的方法,该方法能够准确的识别会话,更为合理有效。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅