作者:施振佺; 陈世平 期刊:《运筹与管理》 2019年第12期
传统的K-modes算法采用了简单的0-1匹配来计算属性间的相异度,后改进为频率计算相异度,但是他们都忽略了各属性间的差异。本文研究了基于粗糙集和知识粒度的属性加权算法,该算法既克服了属性的冗余问题又综合考虑了各属性间的差异。在此基础上,通过对传统K-modes算法进行属性加权来改进K-modes算法中忽略的属性间差异问题。通过与其他的K-Modes算法进行实验比较,结果表明新的算法更加有效的。
作者:宋爱香; 吴丹; 马冲 期刊:《江苏科技信息》 2020年第01期
文章针对高校师生用户对数字图书馆的推送服务满意度进行了调研分析,结果显示用户对图书馆的推送服务满意程度不高。基于此类问题,文章根据高校用户属性特点进行k-means聚类研究,使推荐信息时考虑用户自身属性特点,包括年纪、专业和目的等特点,并据此设计了混合属性的距离函数。建立的基于聚类算法的数字图书馆知识推送服务,提高了原有相似信息对用户的模糊推荐效果,提高了用户体验。
作者:郑建锋; 艾鸿宇; 童志明 期刊:《信息技术》 2020年第03期
由于电力负荷的不确定性,负荷模型难以建立,所以很难提供有效数据进行负荷管理。目前,利用基于环境信号的负荷模型参数辨识方法,虽然可以很频繁地进行负荷模型参数辨识,但由于数据的不确定性,造成产生很多不同识别结果。针对数据平台的这一特性,文中提出了一种负荷模型参数聚类方法,从辨识结果中提取具有代表性的负荷模型参数,为负荷管理的数据平台架构提供有效支撑。为了得到更好的聚类结果,采用基于故障后响应曲线的模型距离进行...
作者:张强; 张勇; 刘芝国; 周文军; 刘佳慧 期刊:《计算机工程》 2020年第03期
针对基于人工建模方式的手势识别方法准确率低、速度慢的问题,提出一种基于改进YOLOv3的静态手势实时识别方法。采用卷积神经网络YOLOv3模型,将通过Kinect设备采集的IR、Registration of RGB、RGB和Depth图像代替常用的RGB图像作为数据集,并融合四类图像的识别结果以提高识别准确率。采用k-means聚类算法对YOLOv3中的初始候选框参数进行优化,从而加快识别速度。在此基础上,利用迁移学习的方法对基础特征提取器进行改进,以缩短模型...
聚类算法是数据挖掘中的核心技术,虽然聚类算法已被广泛深入的研究,但其应用在数据挖掘领域时间不长,其间产生了许多不同的适用于数据挖掘的聚类算法。本文介绍了聚类算法的发展史和概况,详细说明了聚类算法的分类,最后总结了聚类算法的应用。
作者:高强; 郑乐为; 童存智 期刊:《电力大数据》 2019年第03期
随着智能电网的快速发展和调控一体化运行体系的深入推进,接入调控中心的输变电设备集中监控信息数据成倍增长,如何从海量的监控信息数据中挖掘出需要的信息,直接指导监控员的工作,由被动监控转为主动监控,显得尤为迫切。国网浙江省电力有限公司针对现状率先开展了输变电设备集中监控信息大数据技术的研究与应用,基于智能电网调控技术支持系统搭建了一个由各类监控信息分析模块组成的信息分析中心,通过对输变电设备告警信息进行挖...
作者:高志强; 李庆鹏; 胡人远 期刊:《网络与信息安全学报》 2016年第11期
针对经典聚类方法无法应对任意背景知识下恶意攻击者在海量数据挖掘过程中的恶意攻击问题,结合差分隐私保护机制,提出一种适用于Spark内存计算框架下满足差分隐私保护的聚类算法,并从理论上证明了改进算法满足在Spark并行计算框架下的ε-差分隐私。实验结果表明,改进算法在保证聚类结果可用性前提下,具有良好的隐私保护性和满意的运行效率,在海量数据聚类分析的隐私保护挖掘中,具有很好的应用前景和价值。
作者:洪波; 魏德宾 期刊:《火力与指挥控制》 2019年第12期
基于单一控制器的SDN架构容易导致无线网络性能受到影响,尤其针对高动态无线网络,将大幅降低其健壮性和鲁棒性。鉴于此,提出了一种分布式软件定义网络架构(Distributed Software Defined Wireless Network,DSDWN),该架构是基于完全分布式和分层式SDN思想提出的,包括主从控制器和事件传播系统,在该架构下提出了控制器系统的配置策略和主控制器的选择策略。仿真验证表明,提出的控制器配置策略在时延方面优于贪婪算法和聚类算法,更适...
作者:聂坚; 杨绍丽; 杜义斌; 严园; 严继林 期刊:《中国中医药科技》 2020年第01期
目的:利用中医传承辅助平台系统软件,收集云南省名中医严继林教授治疗咳嗽的用药经验并分析组方规律。方法:通过对严继林教授治疗咳嗽的临床病案及处方进行筛选,运用关联规则、复杂系统熵聚类等无监督数据挖掘方法,将严继林教授治疗咳嗽的用药经验整理出处方中各种药物的使用频次及药物之间的关联规则并分析。结果:对筛选出的92个方进行分析,确定处方中药物的使用频次,药物之间的关联规则,挖掘出24个核心组合和6首新处方。结论:严...
作者:孙锋; 刘杰; 周建辉; 杨梓辉; 毛伟兰 期刊:《中国舰船研究》 2019年第S01期
[目的]船舶轴系监测系统具有监控对象多、测试数据量大和存储空间需求大等特点,如果存储方案不合理,数据未预先统计和分类存储,会导致数据不便于检索、计算和分析。为此,提出针对测试数据的批量统计特征数据及分表存储的方法。[方法]在现有数据库的基础上,设计时间序列特征数据表和汇总表,以及统计测试数据的均值、极值、标准差、偏度等的流程;采用仿真对比,选择均值和偏度作为特征向量;通过DBSCAN聚类设计传感器数据异常识别算法,...
随着我国高校信息化水平的进一步提高,形成了校园一卡通数据、教务成绩数据、图书馆借阅数据、网络平台学习数据等多维数据存储系统,数据日益膨胀,初步形成了高校的大数据环境。传统的校园管理理念和数据分析方法已经无法满足日趋增长的信息处理需求。依托高校数字化平台,研究基于高校大数据的学生行为分析系统,采用数据挖掘与机器学习等相关方法,分析学生在校的学习、消费等行为,构建"学生行为画像",为客观全面的评价学生提供依据...
作者:许志凯; 徐志明; 李栋; 李生 期刊:《智能计算机与应用》 2011年第1X期
为了更加准确有效地从海量的互联网网页中获取感兴趣的信息,设计并实现了一个面向互联网新闻的话题追踪与检测系统,并在该系统的基础上提出了面向海量互联网网页时话题检测中聚类算法选择策略以及一个基于多重特征的话题追踪模型,该模型能够很好地区分相似与相同的话题,并且话题追踪正确率达到了85.7%,实验结果表明文中系统能够有效地检测和追踪互联网上的话题。
作者:胡劲松; 胡君慧; 官澜; 朱承治 期刊:《微型电脑应用》 2020年第01期
针对目前三维设计评审仍处于起步阶段,三维设计评审的流程、评审指标库等相关规范还未统一的问题,设计了对三维设计成果进行评审的计算机辅助系统。通过BIM工具建模、机器学习算法预警技术等,建立起满足工程建设相关标准规范要求的数字化评审计算机辅助系统。该系统立足实用化,结合智能评审的要求。同时系统梳理了各专业的共性需求,深入分析了三维模型业务评审应用场景,实现了三维设计成果模型识别、评审指标数据自动提取、空间量...
作者:任禹丞; 徐超; 赵磊; 贾静; 彭路; 周子馨 期刊:《计算机系统应用》 2020年第01期
提升客服系统对于群体客户用电问题的分析与理解能力是改善电力行业客服质量的重要途径之一.本文基于数据挖掘中的聚类技术,以电力客服中心记录的客户用电问题为数据基础,建立客户服务数据分析聚类模型,进而提出了针对用电问题分析的改进的自适应特征权重K-Means聚类算法.实验验证了该方法可快速准确地实现客服数据的自动聚类,可挖掘出隐藏的客户用电问题关键信息,为改进用电力客服质量与潜在服务风险预测提供了技术支撑.
作者:邱云飞; 张伟竹 期刊:《图书情报工作》 2019年第22期
[目的/意义]在基于社会网络的用户画像研究中,针对传统用户建模难以处理复杂网络关系,群体构建多基于内容,以及群体相似度低或紧密性差的问题,提出基于网络结构和文本内容的群体画像构建方法。[方法/过程]首先,采用卷积神经网络方法,融合网络结构和文本内容两方面特征将网络用户表示成空间向量,其次,在k-means算法基础上结合模块度计算方法,对空间向量进行聚类,然后,在爬取的中英文数据集上分别进行对比研究,最后,从中文数据集中选...
传统光纤网络数据具有容量大和分散性强的特点,导致挖掘的聚类性不好。提出基于联合参量估计的光纤网络数据的聚类算法。分析光纤网络数据的存储结构模型,结合数据结构的优化重组和自适应调度方法进行光纤数据的离散化特征重构,提取光纤数据的关联特征,采用联合参量估计法方法进行模糊信息聚类处理,根据数据聚类结果,结合先验样本迭代训练方法,实现对光纤网络数据的挖掘。仿真结果表明,采用该方法进行光纤存储数据挖掘的模糊聚类性...
作者:樊晓博; 张慧军; 张小龙 期刊:《计算机工程与应用》 2019年第23期
企业日志数据,即员工在企业内部使用网络服务时系统保存的记录,包括员工网页访问日志、邮件日志等。在一定程度上反映了企业内部的组织结构、员工的日常工作模式和各种异常情况等。对日志数据进行分析有助于企业高层及时把控企业的运行状况,发现企业潜在威胁,进而帮助更好地进行决策。现有的企业日志分析方法大多是在单一数据基础上使用数据挖掘和机器学习等算法来进行分析。将以数据为中心的分析算法和以人为中心的交互式可视化结...
作者:林巧民; 潘敏 期刊:《计算机技术与发展》 2020年第01期
伴随情感计算和人机交互界面的快速发展,计算机的情感识别能力受到越来越多的关注。近年来针对面部表情识别存在很多方法,然而对于表情层次的细分研究却不多。目前网约车司机以及公交乘客的情绪失控情况无法被摄像头监控系统及时检测,该研究有助于此问题的解决。文中针对"愤怒"表情进行层次细分研究。首先通过RBF神经网络进行大类情绪识别,然后从已识别‘愤怒’情绪的多帧视频图像样本中选取出部分连续的图像样本。接着把选取出的...
作者:陈子豪; 李强 期刊:《计算机科学》 2019年第12期
随着数字货币的普及与发展,区块链技术进入了大众的视野,并被誉为信用历史上第四个里程碑,是未来信用的基石[1]。但与此同时,区块链技术也面临着共识效率低、算力浪费等问题。文中利用K-medoids聚类算法对参与区块链共识的大规模网络节点根据特征进行聚类与层次划分,再将改进的多中心化实用拜占庭容错算法应用于这种聚类后的分层模型中。另外,为了提升聚类算法在多种场景下对区块链模型中共识节点进行聚类的可控性,对K-medoids算法...
作者:蔡莉; 江芳; 许卫霞; 梁宇 期刊:《小型微型计算机系统》 2019年第10期
为了减少大规模数据集在聚类过程中的计算复杂度和运行时间,本文提出了一种基于自适应网格划分和决策图的聚类算法AGPCA.首先,采用相对熵自适应划分数据空间,形成明显的稀疏网格和稠密网格.将网格作为聚类对象,降低以点为对象之间的距离计算复杂度.之后,依据决策图思想确定簇心网格对象,并通过Kd树完成邻接网格的查找和合并以实现聚类.以多个标准数据集和真实的出租车GPS轨迹数据作为测试对象,并与现有一些先进的聚类算法进行对比...