首页 期刊 智能系统学报 信息熵度量的离群数据挖掘算法 【正文】

信息熵度量的离群数据挖掘算法

作者:张贺 蔡江辉 张继福 乔衎 太原科技大学计算机科学与技术学院 山西太原030024 北京航空航天大学自动化科学与电气工程学院 北京100191
离群数据   信息熵   离群度量因子   数据挖掘  

摘要:离群数据挖掘是为了找出隐含在海量数据中相对稀疏而孤立的异常数据模式,但传统的离群数据挖掘方法受人为因素影响较大.通过引人基于信息熵的离群度量因子,给出一种离群数据挖掘新算法.该算法先利用信息熵计算每个数据对象的离群度量因子,然后通过离群度量因子来衡量每个对象的离群程度,进而检测离群数据,有效地消除了人为主观因素对离群检测的影响,并能很好地解释离群点的含义.最后,采用UCI和恒星光谱数据作为实验数据,通过对实验的分析,验证了该算法的可行性和有效性.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅