作者:张润; 冯云霞 期刊:《计算机技术与发展》 2020年第02期
随着人民生活水平的不断提高,肿瘤疾病的人数在不断增多,其中肺癌是21世纪严重危害人类健康的重大疾病。面向肺癌电子病历如此庞大的数据量时,传统Apriori算法的串行计算方式需要频繁扫描数据库,会消耗巨大的内存占用量。对此,提出一种基于改进Apriori算法的肺癌风险评估因素分析的方法。运用Hadoop平台实现并行Apriori算法的优化,应用HBase文件存储系统对海量数据分布式存储以及Map Reduce框架进行分布式计算,最后给出基于Hadoop...
在试卷知识点分析的研究中,应用关联规则算法进行关联分析,可以发现存在于项目集合或对象集合的频繁模式、关联、相关性或因果结构。在常用的关联规则算法中,Apriori算法操作简单,具有良好的稳定性和使用价值,广泛用于商业和医疗研究等,在教育管理领域已有教育工作者使用Apriori算法进行初步研究,验证了该算法的可行性。但是Apriori算法也具有产生大量冗余关联规则、无法挖掘出事务之间逻辑关系等局限性,研究过程中我们发现可以通...
作者:孙粼希; 谢雁鸣; 黎元元; 孟祥; 王欢; 庄严 期刊:《世界中医药》 2020年第01期
目的:基于真实世界分析研究速效救心丸应用的临床特征,探寻联合用药规律线索,为下一步深入探索提供参考证据。方法:提取2001—2015年全国37家三甲医院中使用速效救心丸的患者信息,将所需数据规范化后,描述分析其临床用药情况,以及使用Apriori算法分析联合用药关联规则。结果:23575例使用速效救心丸的患者中女性稍多于男性,平均年龄72岁,主要分布在心内科(19.13%),住院时间多为15~28 d(38.78%);疗程多≤3 d(86.41%);口服(58.98%)比...
影响机票价格的因素有很多:订票时间、城市、航空公司、节假日、行业市场等,订票时间被认为是价格波动最大的因素,本文通过对大量的机票数据进行分析,利用Apriori算法编写了数据挖掘程序,建立了关联关系模型,通过KI(准确性)、KR(稳定性)对模型结果进行评价,最终得出最佳订票时间,并应用于制定合理的机票政策。
作者:黄秋勇 期刊:《广西科技师范学院学报》 2017年第01期
通过结合云平台的存储能力和并行处理能力,对数据挖掘的Apriori算法进行研究,把传统Apriori算法改进移植于Hadoop平台.改进后的算法在扫描一次数据库后用矩阵的形式表示事务,在生成频繁K项集的过程中只需要把满足条件的事务进行连接并统计支持度,从而减少大数据挖掘中大量无用数据的运算,提高了挖掘效率.
作者:李蒙; 彭榆翔; 李秉祥 期刊:《安康学院学报》 2020年第01期
随着智慧校园建设的推进,大数据技术的快速发展推动了高校学生管理工作的不断创新。本文以陕西LG高校的学生为研究对象,通过采集校园信息系统中的各类应用数据,运用聚类分析中K-means算法对学生校园行为特征进行分类,然后运用Apriori算法对学生行为特征与学业成绩进行关联分析。结果发现,不同学生群体的消费行为、作息行为、学习行为特征与其学业成绩之间具有密切关系。利用这些分析结果,高校可以针对不同类别学生采取差异化管理措...
作者:王奇; 张晗; 宋云海; 尚佳宁; 张厚荣 期刊:《电网与清洁能源》 2019年第09期
针对当前输变电设备运行可靠的重要性,加强对输变电设备的缺陷诊断与预警,是当前思考的重点。结合传统Apriori算法在数据预处理和面对海量数据方面存在的弊端,对传统的Apriori算法进行改进,即结合FP-growth算法和DHP算法的核心思想,构建TD-Tree,进而减少I/O操作;同时引入粗糙集理论对数据进行预处理,以提高基础数据的准确度。最后通过实验验证的方式对上述方法进行验证,得出本文构建的方法在准确率等方面,都要优于BP网络,具有一定...
作者:陈静 期刊:《经济技术协作信息》 2019年第33期
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,其主要目标是从大型的数据库中挖掘出对用户有价值的模式。其中:在事务数据库中挖掘关联规则是数据挖掘领域中一个非常重要的研究课题。本文列举以基于Apriori算法为基础的实例模型,做出简单的决策。
作者:王桌芳; 赵会军; 李聪; 赵煜; 刘震 期刊:《计算机应用与软件》 2019年第12期
对于经典的关联规则数据挖掘算法,其采用的重复性事务分析策略会导致频繁项集在计算中存在一定的不确定性,从而不利于算法的精简和优化。为此提出一种基于兴趣度度量函数的Web服务多类数据挖掘算法。采取差异概率兴趣度量规则对关联规则算法中的时序事务进行估计和权重的预测;基于Web服务用户兴趣度进行约束条件设计,实现数据挖掘关联规则的精简;基于支持度函数和期望函数进行事务项集的提取,结合事务项集的置信度对其规则进行导出...
本文分析了Apriori算法的不足,通过运用Fp-tree的MFLA算法减少了在频繁项目集在总数据库中进行匹配的过程,提高了原算法的计算效率。
笔者以数据挖掘中典型的购物篮分析为案例,通过购物支持度和置信度,分析了频繁项集和关联规则,得出基于Apriori算法的关联分析的基本思想和相关算法流程。基于此,通过具体案例详细分析了Apriori算法的实现过程,并针对Apriori算法实现过程中的优缺点,提出了Apriori算法的改进和优化思想。
作者:王云; 李丛 期刊:《计算机与现代化》 2019年第12期
针对传统Apriori算法挖掘警情数据的缺点,提出一种改进的Apriori算法。该算法首先在关联规则发现阶段引入权值参数,设计支持度阈值函数,以挖掘不常发生的重大案情发生规律;然后提出一种压缩矩阵优化算法,将数据压缩存储在只有0或1的矩阵中,并用2个数组来记录矩阵中每一行及每一列1的总数,可多次压缩矩阵,提升挖掘效率;最后将改进的算法用于实际的警情数据挖掘分析,给出关联规则挖掘结果。实验表明,改进算法不仅执行效率较传统算法...
作者:廖纪勇; 吴晟; 刘爱莲 期刊:《计算机工程与科学》 2019年第12期
针对关联规则中Apriori算法存在的缺点,提出了一种基于布尔矩阵约简的Apriori改进算法。在该算法中,将事务数据库转换为布尔矩阵,并在矩阵最后增加1行2列,用来记录相同事务的个数和矩阵行与列中“1”的个数。将矩阵各列元素按支持数升序排列,使得算法在压缩过程中减少了扫描矩阵各列的次数,缩短了算法的运行时间。另外,为了提高算法的存储空间利用率,增加了删除非频繁项集的操作。实验结果和性能分析表明,相比现有的算法,改进后的...
作者:闫坤; 沈苏彬 期刊:《计算机技术与发展》 2020年第01期
随着移动通信技术、物联网技术和传感器技术等的快速发展,智能家居行业发展迅速。由于人们生活水平的提高,对智能家居可以提供的智能服务需求正在增加。然而,现有的智能家居系统只能根据预设的控制方法和规则简单地重复运行,并且根据用户的日常生活习惯,不能随时提供满足其个性化需求的服务。试图为智能家居提供个性化服务,使智能家居的服务能够更加灵活、智能和人性化,报告了智能家居和关联规则挖掘的研究现状,对提高Apriori算法...
作者:闫帅领; 程凤林; 徐蕾; 申红莲; 刘光展 期刊:《福建电脑》 2019年第10期
目前高校对成绩的预警主要是统计学生现有成绩并给予警告通知,该方法并不能真正起到成绩预警的功能。本文提出一种基于数据挖掘的对未来不合格成绩的概率预警机制。该机制通过研究历史成绩数据库,找出非同期成绩的关系并建立概率模型,然后通过与所预测的学生现有成绩以及变化概率,预测未来大概率不及格课程成绩,以便达到成绩概率预警效果。
作者:邢俊凤; 马宁; 柳原 期刊:《电子世界》 2019年第21期
本文在收集整理大量中医治疗消渴症处方的基础上,通过对处方数据进行预处理,进而采用聚类分析k-means算法和关联规则Apriori算法,对处方数据进行挖掘,分析中药治疗消渴症处方用药规律以及药物之间的关联规则,以期为中医药治疗消渴症提供理论参考和科学依据。引言:消渴症最早在《黄帝内经·奇病论》一书中有论述,在中国历代的中医古籍中均有论述。消渴日久,病情失控,则阴损及阳,热灼津亏血瘀,而致气阴两伤,阴阳俱虚,络脉瘀阻,经脉失...
针对煤矿安全生产过程隐患数据众多,缺乏有效管控的特点。本文基于数据挖掘技术,对大量的隐患数据建立数据仓库,将预处理后的数据采用Apriori算法进行关联规则挖掘。实验结果表明,得到的关联关系可以作煤矿安全生产管理的重要决策依据。具有较好的实用性和参考意义。
传统应用于图书管理系统的Apriori算法因数据库扫描次数过多,以及候选项集数量过大导致系统运行缓慢,为解决此问题,设计基于改进Apriori数据挖掘算法的信息推荐图书管理系统。系统结合C/S架构与B/S架构,分别向图书馆工作人员和借阅者开放图书信息。系统功能模块中数据预处理子模块从读者借阅数据库中提取借阅者以及图书相关信息数据,对数据进行清洗、转换以及集成处理后,关联规则挖掘子模块利用改进Apriori算法依据处理后的数据,挖...
作者:范路; 马坤; 李振泉; 高立新; 史瑶; 刘纳; 吴晓; 岳宇; 王武昌 期刊:《油气田地面工程》 2019年第10期
作为油田生产的重要环节之一,集输系统仍面临资源利用率较低的现状,因此,随着油田信息化程度的提高,大数据挖掘技术成为一种全新的集输系统能耗优化方法。以胜利油田某联合站内泵的海量生产数据为基础,通过分析挖掘原始生产数据,对生产数据进行数据清洗、数据规范化和数据离散化。利用关联分析中的Apriori算法挖掘出泵能耗及效率的影响因素,得到合理的参数范围,使泵运行达到最优,从而提高系统整体的工作效益。由此可知,关联规则分...
作者:宋丽萍 期刊:《阜阳职业技术学院学报》 2014年第02期
在高校图书馆进行生态化、数字化建设的今天,提高图书馆的个性化服务质量已成为迫切需要。本文介绍了关联规则的基本原理,阐述了关联规则挖掘分析的过程及结果,论述了关联规则分析结果在图书馆工作中的应用,以此可以为读者提供准确的服务,促进图书馆的生态化建设。