首页 优秀范文 数据挖掘课程

数据挖掘课程赏析八篇

时间:2023-01-03 00:41:12

数据挖掘课程

数据挖掘课程第1篇

关键词: 数据挖掘; 知识体系; 案例教学; 教学评价

中图分类号:TP311 文献标志码:A 文章编号:1006-8228(2014)04-59-03

Abstract: With the advent of the era of big data, data mining has become an essential technology which has important social value in the field of business, healthcare, manufacture and administrative management, etc. In many universities, the course of data mining is an important course which is integrated with other disciplinary knowledge and plays an important role in talent cultivation. According to the characters of big data, the knowledge hierarchy data mining is presented, and case teaching and new teaching evaluation method in graduate students' data mining course are discussed. The result shows that the effect is good and it is welcomed by graduate students.

Key words: data mining; knowledge hierarchy; case teaching; teaching evaluation

0 引言

近年来,传统科学研究(如天文物理学、生物医学等)、电子商务、网络搜索引擎(如GOOGLE和百度等)和物联网等产生的数据已经以PB或ZB(10的21次方)来计算。以分布式数据仓库、流计算的实时数据仓库技术为代表的最新数据存储技术,让全世界的数据存储量越来越大,由人、机、物三元素高度融合构成的信息化的社会引发了数据规模的爆炸式增长和数据处理模式的高度复杂化,大数据(Big Data)时代已经到来[1]。因此,数据具有越来越强的可视性、可操作性和可用性,能够越来越细致、精准、全面和及时地反映人的思维、行为和情感,以及事物的特性和发展规律,要想让这些大数据以更加有效的方式为提升人类各方面的生产力和生活质量服务,离不开以非平凡的方法发现蕴藏在大量数据集中的有用知识为根本目的数据挖掘技术的支撑。

市场上对于有大数据背景知识又懂数据挖掘技术的专业人才的需求也将越来越大,作为一名高校计算机专业教师,根据自己三年来研究生数据挖掘课程的授课经历,结合当前大数据的时代背景,对数据挖掘课程教学进行了新的思考和探索。

1 明确大数据背景下学习数据挖掘知识的重要性

1.1 大数据的定义

“大数据”是最近几年才出现的新名词,尚无统一的概念,维基百科上的解释是:大数据是由数量巨大、结构复杂、类型众多数据构成的数据集合,是基于云计算的数据处理与应用模式,通过数据的整合共享,交叉复用形成的智力资源和知识服务能力。

1.2 大数据的特征

大数据的特征可以总结为四方面,即4V。

⑴ 数据量浩大(Volume)――数据集合的规模不断扩大,已从GB到TB再到PB级,甚至开始以EB和ZB来计数。例如:1立方毫米电子显微镜重建出的大脑突触网络的图像数据就超过1PB。

⑵ 模态繁多、异构(Variety)――大数据面向的是一切计算机可以存储的数据格式,类型包括结构化数据、半结构化数据和非结构化数据,包括互联网上的各种网页、图片、音频、视频、文档、报表,以及搜索引擎中输入的关键词、社交网络中的留言、喜好和各种传感器自动收集的监控结果等等。

⑶ 生成快速(Velocity)――大数据往往以数据流的形式动态、快速地产生,具有很强的时效性,同时,数据自身的状态与价值也往往随时空变化而发生演变,数据的涌现特征明显。

⑷ 价值巨大(Value)――数据显性或隐性的网络化存在使得数据之间的复杂关联无所不在,将对信息科学、社会科学、网络科学、系统科学、心理学、经济学等诸多领域的研究和应用起到革命性的作用,价值巨大[2]。

Gartner、IBM和牛津大学2012年联合的关于大数据的研究报告指出:交易数据、记录数据、事件和电子邮件是四大主要数据;数据挖掘,数据可视化,预测,建模与数据优化是五大数据能力[3]。大数据的潜在价值只有通过数据挖掘才能显现,因此,国外的Google、IBM、Amazon、Oracle、Microsoft、EMC;国内的腾讯、百度、新浪、淘宝等知名企业已经开始着眼大数据,从不同角度进行数据挖掘,以便改善自身服务,创造更大的商业价值。所以,作为高校教师,首先要让学生了解大数据的基本特点,明确数据挖掘知识和技术对当今社会的重要意义。

2 利用概念图,构建数据挖掘课程的知识体系结构

在大学里,设置一门课程,不能只关注这门课程所含的内容,更要考虑教育培养学生基本专业能力、可持续发展能力等本质性的问题。

数据挖掘是一门结合数据库技术、统计学、机器学习、神经网络、知识系统、信息检索、高性能计算和可视化等多门学科知识的交叉学科[4]。而且,该课程既包括各种理论知识,又离不开相关的实践技术,整个教学过程是培养和提高学生的创新能力和综合解决问题能力的重要途径。因此,针对计算机专业的学生,教学的首要任务是构建起整个课程的核心知识结构(如图1所示),同时,简单介绍相关的统计学、机器学习等计算机专业学生不太了解的非专业知识。

课程核心知识结构是教学的主线,是学生必须要掌握的。首先,让学生明确数据挖掘前要先经过预处理,再存入数据仓库;其次,针对具体情况利用相关的挖掘工具和挖掘算法进行挖掘;最后,挖掘结果以可视化的形式有效地展示给用户。教学的重点是挖掘算法和挖掘工具。对于挖掘算法,以数据挖掘国际会议ICDM(the IEEE International Conference on Data Mining)的专家评选出的十大经典算法(见表1)为主[5],结合相关实例给学生介绍各种算法的基本思想和相关概念,重点介绍使用较多的分类、聚类、关联、序列和机器学习这几种算法,先为学生打下良好的理论基础。

3 以实例为切入点,注重理论结合实践

数据挖掘课程主要针对我校研究生开设,考虑到学生就业和当前市场需求,以及课程本身实践性强的特点,在教学过程中要注重理论结合实践,注意培养学生解决实际问题的能力。因此,在给学生介绍目前常用的数据挖掘工具(如IBM Intelligent Miner、SAS Enterprese Miner、SPSS Clementine、Weka等)的基础上,结合市场应用需求,以实例为切入点,分别分析数据挖掘在互联网日志分析、电子邮件分析、互联网广告挖掘、电子商务、移动互联网等各大领域中的实际应用情况和成功案例(表2)。同时,还可以从内容挖掘、结构挖掘和用户访问模式挖掘这三个方面简单介绍WEB挖掘的基本知识[6]。这样,课程本身就脱离了枯燥的理论,让学生对数据挖掘有了感性认识,激发学习兴趣。

⑵ 过滤垃圾邮件。\&互联网广告\&⑴ 通过大数据挖掘,精准定位各类客户的广告形式;

⑵ 准确评估广告效果。\&电子商务\&用数据提升整体营销;通过日志挖掘做客户分析;用序列算法分析商品上架时间;用聚类算法对商品分类、提升会员管理。\&移动互联网\&⑴ 锁定用户的数据价值,通过地理位置信息挖掘出有价值的东西;

⑵ 文本挖掘。\&]

在教学过程中,贯穿以“能力培养为目标”的实践教学理念,提供有效的网络资源,让学生自己动手动脑,分析成功案例,完成教师给定的虚拟挖掘任务,强化学生参与意识,教师在以学生为主体的教学过程中当好指导者和激励者,从而充分调动学生的主观能动性,掌握不同应用领域大数据的挖掘问题的基本解决方法,培养学生的创新能力。例如,给学生一个文本挖掘的分类题目,让他们熟悉从原始数据的清洗、预处理、降维、建立模型、测试、得到结论等一系列环节。

4 改革教学评价,实施分类化评价

数据挖掘课程是一门融合了多个学科的实践性很强的课程,对应的考核方式应该与其他专业课程有所区别,应该更重视学生学习过程中的表现和能力的提升。

理论知识的考核注重学生对数据挖掘基本概念、挖掘流程和主要挖掘算法的掌握情况,主要以试卷考核的方式为主,注意主观题和客观题的数量比例,采用统一考核方式和评判标准。对于实践技能的考核,主要强调的是学生对不同类型数据进行挖掘时应掌握的相关软件使用技能的考查,考核时除了要体现学生对实验原理的掌握外,更重要的是要反映出学生在实验方法的掌握、设计、操作过程中的实际能力,我们取消了以往把一次性考试结果作为总成绩的方法,而把学生平时课堂实验成绩作为总成绩的主要部分,考核成绩占课程总成绩一定比例。

教师教学质量的评价与学生考核成绩相对应,可采用单独评价和统一评价两种方式。单独评价是指将社会实践作为一个独立的质量评价过程对教师教学质量进行考核;统一评价是指将教师实践教学与理论教学综合起来统一考核,以一定比例计入教师总体评价。

无论是对学生,还是对教师,这种分类化的教学评价方式,不仅有利于学生实际能力的培养,而且对教师的教学水平也是一种促进,有利于课程教学质量的不断提高。

5 结束语

大数据时代,谁能发掘出数据背后的巨大商业和社会价值,谁就能在激烈的市场竞争中处于优势。数据挖掘作为计算机应用专业的研究生核心课程之一,也是学生今后就业必需的专业技能之一。以往的教学过程理论性强,枯燥乏味,考核形式单一,学生学习热情普遍不高,不利于学生专业能力的培养。本文结合当前大数据的时代背景,在构架课程核心知识体系的前提下,结合实际应用领域和案例,分析数据挖掘常见算法和常用工具,强调学生的参与和主观能动性的发挥,而采用分类化的教学评价又能比较客观、公正地评价学生对课程知识和专业实践技能的掌握情况以及教师的教学效果。课程开设三年来的教学实践证明,学生综合运用计算机专业知识的能力得到提高,理论与实践结合的创新能力得到锻炼,教师在教学过程中不断完善了自身的知识结构,提高了教学水平,实现了教学相长,得到了学生的好评。

参考文献:

[1] Anand Rajaraman, Jeffrey David Ullman.大数据:互联网大规模数据挖掘与分布式处理[M].人民邮电出版社,2012.

[2] 李国杰.大数据研究的科学价值[J].中国计算机学会通讯,2012.8:8-15

[3] Jiawei Han,Micheline Kamber,Jian Pei等.数据挖掘概念与技术(第3版)[M].机械工业出版社,2012.

[4] 王珊,王会举,覃雄派等.架构大数据:挑战、现状与展望[J].计算机学报,2011.10:1741-1743

数据挖掘课程第2篇

关键词: 数据挖掘; 课程内容体系; IT专业; 教学效果

中图分类号:G642 文献标志码:A 文章编号:1006-8228(2014)11-65-02

Course construction of data mining course for IT specialty in application-oriented university

Li Zhong, Li Shanshan

(Institute of Disaster Prevention, Sanhe, Hebei 065201, China)

Abstract: Aiming at the content differences of data mining course in the application-oriented university, the training objectives and requirement for different specialty are analyzed. The content system and hours arrangements of data mining courses for IT specialty starting are given from the three major functions of data mining. Based on the last two years' student teaching effectiveness of data mining courses, it is concluded that combining theoretical and experimental training content settings with appropriate teaching methods can improve learning interest, stimulate learning enthusiasm, improve operating ability and achieve training objectives.

Key words: data mining; course content system; IT specialty; teaching effectiveness

0 引言

毋庸置疑,我们正处在信息时代。根据国际互联网管理机构2012年的数据,每天全球互联网流量累计达1EB(即10亿GB),这意味着每天产生的信息量可以刻满1.88亿张DVD光盘[1]。要想在如此浩瀚的数字海洋里寻找有用的信息,简直是大海捞针!因此数据挖掘技术应运而生。大概十几年前,微软创始人比尔・盖茨就预言,数据挖掘技术将是未来计算机发展的重要方向之一,事实也的确如此。

数据挖掘技术诞生于20世纪80年代末,是统计学和计算机科学的交叉学科,涉及数据库技术、统计学、机器学习、神经网络、模式识别、知识发现、专家系统、信息检索、高性能计算、可视化以及面向对象程序设计等若干学科知识,在商业、金融、保险、体育、勘探、生物技术等领域获得广泛应用。也正因为该课程涉及的内容宽泛,要求知识面宽广、数学基础扎实等,前几年主要在研究生阶段开设。但是随着信息技术的快速发展,本科生能力要求提高,知识传授的重心下移,很多高校已在本科阶段开设数据挖掘课程,以提高大学生解决实际问题的能力,进而为课程设计和毕业设计打下必要的基础[2]。

1 国内高校本科数据挖掘课程开设现状

通过院校实地交流,结合网络搜索,我们已经收集了十几所高校的数据挖掘课程教学大纲,开设专业包含有计算机类专业、经济统计类专业、电气自动化类专业、生物技术专业等,各专业根据自己的人才培养目标制订教学大纲、教学计划、考试大纲等,其内容存在很大差异。其中985、211高校主要以英语授课,采用国外原版教材,课程内容涉及算法、编程较多;而一般院校多采用中文教材,根据专业不同,内容也有很大差异。

经济统计类专业开设数据挖掘课程,要求学生了解什么是数据挖掘,以及如何用数据挖掘来解决实际问题,了解如何通过几种数据挖掘技术建立数学模型,了解主流数据挖掘系统的特点,能够安装、使用,要求能够熟练使用典型的挖掘工具对实际数据进行分析,具备从数据资源提取信息与知识并进行辅助决策的基本能力。

自动化专业开设数据挖掘课程,要求学生了解数据挖掘概念、原理、过程,学会利用数据挖掘技术处理问题,了解有关数据挖掘算法原理,熟练运用数据挖掘技术建立数学模型,要求能够熟练使用数据挖掘软件解决问题。

数据挖掘课程第3篇

关键词:数据挖掘;概念描述;类比较;C语言程序设计

中图分类号:TP311文献标识码:A 文章编号:1009-3044(2008)16-21267-03

Data Mining Based Course Competence Development of C Programming Language for Vocational College

GUO Xiao-chen1,2

(Chenzhou Vocational Technical College,Chenzhou 423000,China)

Abstract:In this paper we utilize the data mining technology into the course of C programming language in vocational colleges in order to classify and predict the examination result, and eventually find out the implied information. This is helpful to make guidance for improving the quality of teaching and deepen the teaching reform.

Key words: data mining; concept description;class comparision; C Programming Language

1 引言

C语言程序设计课程是计算机应用和电子信息工程专业的必修程序设计课,是知识性、技能性和实践性很强的课程。主要培养学生利用计算机来处理实际问题的能力和培养学生程序设计的思维能力,使学生能够掌握C语言的基本语法和算法,能利用C语言进行基本的程序设计。

C语言程序设计主要由数据描述、程序控制两大模块组成,包括基础数据类型、流程控制、函数和复杂数据类型等四个单元的内容。笔者从事多年的C语言程序设计教学工作,如何利用有效数据分析工具,将所积累的丰富的数据转换为有价值的知识,了解和分析学生的知识掌握及能力培养情况,并采用相应的教学改革。

2 数据挖掘技术的概念和内涵

数据挖掘(DataMining)是对大量的、不完全的、有噪声的、模糊的、随机的实际数据,进行抽取、转换、分析和模型化处理,从而提取能辅助决策的关键性数据,并能结合应用领域的特点,推导出有用的知识的过程;简而言之,数据挖掘就是深层次的数据信息分析方法。通常采用概念/类描述、关联分析、分类和预测、聚类分析及演变分析等方法来完成数据挖掘。数据挖掘的过程是一个线性的过程,依据不同信息平台的数据类型,采用面向环境的管理方式,实现面向环境要求的数据挖掘。数据挖掘的过程一般由数据准备、数据挖掘、结果的解释与评估四个阶段组成。

3 数据挖掘技术在《C语言程序设计》课程能力培养分析中的应用

3.1 数据仓库的建立

挖掘所需要的数据来源于某高职院校近3年来计算机应用和电子信息工程两专业近860名学生的C语言程序设计这门课程的期末考试成绩、实验成绩及实习成绩,给定属性学号(ID)、姓名(name)、性别(gender)、专业(major)、科类(section)、成绩(result)。成绩部分包括考试成绩(test_result简称为t_r)、实验成绩(experimental_result简称为e_r) 、实习成绩(practice_result简称为p_r)及总分数(total_score简称为t_s),其中总分数=考试成绩×70%+实习成绩×20%+实验成绩×10%。通过对考试试卷的分析统计,基础数据类型(Foundation Data Type简称为FDT)、流程控制(Process Control简称为PC)、函数(Function简称为F)和复杂数据类型(Complicated Data Type简称为CDT)四个单元的分数比重分别为20%,30%,20%,30%,综合考虑各单元的内容,汇总统计出各单元的满分分值为14,21,14,21。

该数据挖掘任务可以用DMQL表示如下:

Define cub discretmath〔ID,name,gender,section,major,result〕。

total_score=sum (result);

define dimension result(test_result,Programes_result,practice_ result);

define dimension test_result(FDT,PC,F, CDT)。

数据仓库的结构如表1:

3.2 数据的预处理

由于现实中的数据多半是不完整的、有噪声的、不一致的,某些学生的成绩会因教师个人感情或其它因素而分数偏高或偏低,从而导致现有分数含有一定偏差的噪声数据,对此可以通过数据的预处理技术改进数据的质量,提高其后的挖掘过程的精度和性能。本文利用数据清理中的聚类中K_平均算法找出孤立点,并利用分箱技术将噪声去掉。表2为经过数据预处理的二维视图。

以上数据仓库中的数据,就是经过预处理后,得到的是集成的、概念分层的、不含有噪声的数据,该数据可以用来进行准确的数据挖掘工作。

3.3概念/类描述

3.3.1数据概化

数据库中的数据和对象通常包含原始概念层的细节信息,在多数情况下,感兴趣的一般是在不同抽象层上得到的数据的量化信息或统计信息。因此,首先采用解析特征化进行属性相关分析,来帮助识别不相关或弱相关属性,将它们排除在概念描述过程之外。概化过程如下:

1)收集目标类数据,它由计算机专业的集合组成,对比类数据取电子信息工程专业的集合;

2)用保守的属性概化阈值进行面向属性的归纳,通过属性删除和属性概化进行预相关分析。

ID:由于ID存在大量不同值,并且其上没有概化操作符,该属性被删除;name:由于name存在大量不同值,并且其上没有概化操作符,该属性被删除;gender:由于gender只有两个不同值,该属性保留,并且不对其进行概化;major:假定已定义了一个概念分层,允许将属性major概化到值{计算机应用,电子信息工程};section:假定已定义了一个概念分层,允许将属性科类概化到值{理科,文科,对口};total_score:该属性存在大量不同值,因此应当概化它。假定存在total的概念分层,将分数数值区间{100_85,84一70,69_60,59_0}按等级(grade){A,B,C,D}分组,这样该属性可以被概化。

表3通过对表2的数据进行概化得到的关系

3.3.2类比较的实现

通过概化处理,数据仓库中的属性基本已经得到了单个类的描述。但我们希望挖掘一个描述是它能将一个类与其它可比较的类相区分,因此采用挖掘类比较来实现。现给定了属性gender, section,major, test_result,program_result,practice_ result和grade。

1)专业类别分析

首先确定目标类与对比类为属性major中计算机应用和电子信息工程两个不同专业的学生;其次,对两个数据上进行维相关分析,不相关或弱相关的维从结果类删除;再次,在目标类上进行同步概化,产生主目标类关系,如表4所示。

从表4可以看出,与电子信息工程专业相比,计算机应用专业的学生趋向平均分、实习成绩及实验成绩这三部分分数较高,体现出学生在知识应用能力和计算机编程能力上较强,但对知识掌握出现两极分化严重,针对这部分基础知识掌握不牢固的学生,教师在执教时就应考虑加强基础知识的巩固。相对而言电子信息工程专业的学生对基础知识的掌握基本较好,但对该课程的灵活应用有所欠缺,这就使得在教学过程中应适当注重培养学生的应用能力,加强对他们编程、实验及实习的辅导。

2)性别类别分析

首先确定目标类与对比类为属性gender中的男和女;其次,对两个数据上进行维相关分析,不相关或弱相关的维从结果类删除;再次,在目标类上进行同步概化,产生主目标类关系,如表5所示。

表4 主类(计算机应用)与目标类(电子信息工程)关系 表5 主类(男)与目标类(女)关系

从表5可以看出,与女生相比,男生从总体上对该门课程的学习效果较差,不及格率较高,且优秀率低,基础知识掌握不牢固,体现出不少男生学习态度不端正,目的不明确,缺乏学习的积极性。而女生这门课的成绩比男生好,优秀率高,及格率高,对基础知识掌握牢固,但在知识的应用能力方面欠佳不能很好地灵活运用;由此可见,教师在教学过程中须考虑学生的性别差异,因材施教。

3)科类类别分析

首先确定目标类与对比类为属性section中文科类、理科类和对口类;其次,对两个数据上进行维相关分析,不相关或弱相关的维从结果类删除;再次,在目标类上进行同步概化,产生主目标类关系,如表6所示:

从表6可以看出,与理科类、文科类相比,通过对口高招进来的学生不管对理论知识的掌握还是在实践技能上都比较突出,且目的性非常强。而文科类与理科类相比, 文科类对基础知识的学习优于理科类,但在知识的应用能力上较差,理科类则恰恰相反。可见,教师在教学过程中除了考虑普遍学生存在的问题外,还需要注意学生的差异,对于对口类学生而言应多准备一些相对大的项目,让其能“吃饱”,而对于理科类和文科类学生一方面要加强理论基础知识的学习指导,另一方面要适当注意培养其应用能力,加强对编程及实践方面的辅导。

4 结论

利用多年的C语言程序设计课程的成绩的数据,通过数据挖掘技术探索和发现两个专业学生对这门课程的知识掌握及能力培养的情况,可以有针对性地进行教学内容和教学方式的改革,使得学生更好地掌握C语言程序设计这门课的知识,培养各方面的能力,为以后的课程学习、专业发展打下坚实的基础。

参考文献:

[1] JiaweiH,MichelineK.DataMiningConceptsandTechniquo5[M].Beijing:China Machine Press,2006.

[2] 朱明.数据挖掘[M].合肥:中国科技大学出版社,2O02.

[3] 张锦祥.高级程序设计语言课程教学改革与实践[J].浙江教育学院学报,2007(4)71-76.

[4] 孔垂柳,等.基于程序设计思想的C语言教学方案[J].吉林大学学报:信息科学版,2005(8)5-6.

数据挖掘课程第4篇

关键词:数据挖掘技术;交互课堂;特点

课堂教学是一个具有一定周期性的过程,作为授业者的教师,通过不断的教学实践,对教学设计不断地进行优化、更新、管理及评价的过程。本文探讨通过数据挖掘技术建立一个可以对课堂交互中的信息进行有效整理、合理分析的信息处理模型,从而有效促进教学设计的不断更新。

一、课堂互动中信息的特点

在课堂教学中的信息交互是通过师生人际交流、教学过程等实现的,这决定了这些信息具有以下基本特点:

1.信息采集工作量大

在课堂互动中由于交流过程中所表达的信息类型较多,包括教师的讲授、提问、指示等方面的信息、教师接受学生的意见信息、教师给予学生的鼓励表扬、对学生的建议批评、学生答问信息、学生之间的讨论、思考问题等信息,还有一些是课堂上与正常教学行为不相关的其他信息、课堂外有学生的作业、教师的批改以及自身学习与发展方面信息等。对这些信息数据的采集、处理工作量比较大。

2.可量化性低

课堂内外互动中的信息绝大多数是由言语、肢体语言来交互的,其中一些类似如学生对教学内容与方式的反应、学习中的兴趣爱好、教师与学生互动中交流信息等不容易进行定性量化,导致处理起来比较困难。

3.信息的包容性大

在教学互动过程中的各类信息,如教师的教学方式、教学风格、教学内容的组织、师生的个人思维动态等都包含了各种各类的信息综合体,非常难以从这些信息的表面就判断信息的类属。同时这些信息有些还属于生物信息范畴,难以分析。

4.信息的不确定性

在课堂互动教学过程中对学生当前学习状态、知识的掌握程度的判断是基于教师的个人理解,具有不确定性,是具有一定的误差的。而在教学过程中对提问中学生的反应,判定学生的回答正确与否,都具有教师的主观性。

正是由于课堂互动中的信息具有以上特征,从而使得数据信息采集工作量大,定性量化比较困难。所以很久以来从事教育信息整合的研究者常喜欢于用质的定性研究来评价,随着当前数据处理科学的进步,如何更客观地对课堂中的交互信息进行定性、量化、处理变得尤为重要。通过对潜在信息数据中有价值的内容的提炼、整合、处理,可以及时从里面发现有用的数据信息,从大量互动数据中找到教育规律,用以教师对教学的改进。归根结底,我们对课堂互动中信息的数据挖掘,是为了处理过后的信息反馈与我们的教学,从而更加有效地改进我们教学系统的设计、评价等系统。

二、数据挖掘及其技术

数据挖掘(DataMining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,其目标是支持利用数据进行合理的决策。

根据信息存储格式的不同,用于挖掘的对象有关系数据库、面向对象数据库、数据仓库、文本数据源、多媒体数据库、空间数据库、时态数据库、异质数据库以及Internet等。其任务主要是关联分析、聚类分析、分类、预测、时序模式分析等。

数据挖掘的流程包括以下过程,这些过程不是一次完成的,其中某些步骤或者全过程可能要反复进行:(1)问题的定义;(2)数据准备;(3)数据挖掘;(4)结果分析;(5)知识表示。

三、交互课堂中数据挖掘技术的应用

在交互课堂的设计中我们可以根据课堂互动信息的相关特点,通过整合数据挖掘应用的数据处理优势,从包含海量信息的师生行动和语言互动中发掘并定性出有用的信息。然后通过对这些信息的统计等处理,让隐藏在自然语言下的信息变成电子信息数据,通过教师对数据挖掘规则的参与,有效利用这些信息,从而产生可以指导我们教学实践的数据挖掘结果。下面我们深入探讨一下课堂交互中的数据挖掘应用。

1.课堂互动中数据挖掘的主要任务

利用数据挖掘技术可从以下三个方面对零碎的、不容易识别的课堂互动信息进行挖掘。

(1)对教师教学信息的挖掘。①对教师教学风格、特点的信息挖掘:包括对教师语言特点、提问的比率、提问的开放性程度、与学生的互动能力等主观性因素进行量化,可视化。②对教学信息中可重复部分的挖掘:利用分类、统计、甄别等工具把一些共性的信息提炼出来,拆分教学内容,概括出课堂交互中所传递信息的共性点,分析交互的信息量,进行定性。还可以根据特定的课程进行分析。③教学设计、教学科目设置结构等信息:通过对不同的科目的教学设计的分析,可以了解科目类别之间的关系。通过数据挖掘后直观地分析表和图,系统可为教师提供教学设计对比,促进教学过程的改进。④教师对新技术应用的发现:随着社会的发展和进步,各种各样的信息技术手段在课堂交互中被利用,这些手段为改进课堂互动的效率提供了有效的环境。利用数据挖掘技术,对教师对新技术手段的应用效果及比例进行观察,对新技术手段对课堂交互的促进效果进行评估。⑤师生交互的模式:师生交互的模式有多种多样,数据挖掘利用课程、科目、交互的模式、交互的效果等等进行分析,找出各种因素之间的关联,为教师提供基于实际应用的合理模式推荐。⑥课堂互动过程变动信息:利用定性量化的课堂交互数据,通过数据挖掘得出所需评估科目在交互过程中的变化,以提高教师对交互课堂的教学进程的把握程度。

(2)学生相关信息的挖掘。可以从以下几个方面对学生的课堂反应和表现进行数据挖掘:①课堂参与的投入程度:首先观察学生的参与比例,其次定性参与学生的投入程度。可以对不同的参与程度定性为全部、大多数、少数等,对参与投入的定性可以为:积极、一般。②交互的状态:首先看交互中是不是有多方参与的信息互动,其次看互动中交互是否友善、是否合作良好。③思维反馈的状态:通过学生的反馈及主动性的互动,来看课堂交互的思维反馈状态是否良好。④情绪表现:首先看学生互动中是否有情感上的投入,比如紧张与愉快;其次看学生是否能根据课堂交互的进行及时转变状态,比如前一段谈论气氛热烈,转入后一段的静静聆听。⑤课程状态:首先看学生能否在课程进行中,感到有收获感;其次看学生对后续的课程交互是否抱有期待。

日常的教学实践证明,课堂交互中的学生投入与否,对交互的教学效果有着决定性的影响。假设学生的课堂交互状态不够,那么要找原因的话,就要从教师的教学设计或课堂气氛营造上来找。我们利用学生信息的数据挖掘技术,分析学生在交互的过程中的状态,形成直观的信息材料,为教师课堂教学的组织的改进提供支撑,同时也可以为教师教学效果评价提供依据。

(3)教师、学生课堂交互信息的挖掘。“师生交互”是教学设计实施中的关键环节,交互意味着师生有语言上的交流及行为上的互动。在课堂教学交互过程中一般互动是在授课者与听课者、课程设计与教学实际之间进行的。师生间的交互信息主要表现在师生的互动交流、教师为学生直接提供的课程内容、课程内容的问答和学生错误的反馈等。通过使用数据挖掘技术,深入挖掘教学中的交互信息,让老师改进自己的教学设计及课堂行为,提高实际教学效果,实现师生之间进行有效的互动。

2.挖掘课堂中互动信息的流程

建立课堂互动信息处理的数据挖掘系统现场记录或通过WEB在线应用收集交互信息信息的标准化和信息化处理课堂互动信息分类编码数据信息进行转换、处理数据挖掘挖掘结果分析反馈教学过程。

3.课堂互动信息数据挖掘方法

在数据挖掘方法的选择上,我们主要采用数据挖掘中应用广泛的统计学、关联分析等方法,同时通过数据库软件的数据技术对信息进行处理。在挖掘课堂互动信息的时候,我们需要对时序数据库和序列数据库进行数据挖掘,时序数据库中的数据是一些反映随时间变化的序列值或事件组成的数据库,这些值是等时间间隔采集的数据。利用统计类挖掘工具和数据库技术可以在时序数据和序列数据的挖掘中实现对课堂教育信息的趋势分析、相似性搜索、与时间有关数据的序列模式挖掘和周期性模式的挖掘。

4.基于课堂交互的数据挖掘系统设计

根据数据挖掘模型及课堂互动信息的特点,基于课堂交互的数据挖掘系统可由如下四个部分组成。

(1)数据采集模块:模块采集的信息主要包括课堂教学中教师、学生的各种行为、语言,师生间互动等信息。

(2)数据处理模块:解决语义模糊性,数据库按照元数据标准对数据进行清理、集成和变换,检查数据的完整性和一致性。

(3)数据分析模块:通过分析经过转换的数据,根据数据挖掘的基本策略,对数据进行分析处理,得出结果并输出。如,利用统计类数据挖掘工具对反映一般变化方向的教学趋势变化进行分析,采用加权平均或最小乘2法对时序图上的数据进行处理,以确定数据变化趋势,为后续的教学决策与评价提供依据。

(4)数据评价模块:对提取的信息进行分析,将结果与课堂教学的教育理论,学习理论相结合,根据起始目标的量规对课堂教学效果进行评价、反思教学。将有价值的信息区分出来,通过决策支持工具提交决策者。根据每个处理模块的结果可以决定是否重新进行某些处理过程,在处理的任意阶段可以返回以前阶段进行再处理。在数据挖掘技术实际运用过程中,教师可以根据自身对信息需求的不同,通过对数据挖掘的一些语义规则的选择和自定义得到不同的个性化结果。

数据挖掘课程第5篇

关键词:数据挖掘;网络教学;教学质量

中图分类号:G434 文献标识码:A文章编号:1007-9599 (2011) 16-0000-02

Colleges and Universities Network Teaching Platform Building and Research Based on Data Mining

Huang Wei1,Wen Zhu2

(1.Nanning Vocational and Technical School of Information Engineering College,Nanning530008,China;2.Guangxi International Business Vocational College,Nanning530007,China)

Abstract:This paper analyzes the status of university network teaching platform,the face can not get students to use the scientific study of the feedback network teaching platform,which leads to data mining.Introduced the basic situation of data mining,data mining techniques described in the online teaching platform,the role played by the design of data mining technology based on network teaching platform,and this study is summarized and prospects.

Keywords:Data mining;Online teaching;Teaching quality

一、高校网络教学平台的现状

随着我国高等教育规模的快速发展、信息技术的广泛应用,我国高等教育的教学理念、教学模式、教学环境和教学手段等都有了重大变革,课程教学模式与教学管理模式得到了不断的改进。网络教学平台以其灵活的、开放的、基于资源的特点日益成为现代教育过程中不可替代的部分,不断增长的学生需求和网络所提供的开放式学习机会为网络教学平台的研发、应用和推广提供了优越的发展空间。然而,由于近年来许多高校不断扩招,造成了在校学生规模的剧增,给学校的教学工作带来了许多影响教学质量的问题。而现今的网络教学平台,多是提供教学大纲、教学课件、授课教案、单元测试等教学资源,供学生课后学习。通过信箱、留言板、课程论坛等提供师生实时或非实时的交流。这样的教学平台,只能将知识给学生,并不能从学生对网络教学平台的访问中,科学的获取学生的学习及反馈情况。教师迫切地需要科学地研究分析学生在学习过程中所反映的大量学习情况和知识点掌握情况的数据信息,从中获得知识,继而科学地实施教学改革和课程改革,更大的发挥网络教学平台的作用。

二、数据挖掘技术

传统的网络教学平台无法发现学生在访问该平台时产生的数据所隐藏的关联和规则,无法根据现有的数据预测潜在的规律或未来的趋势。随着技术的不断发展,越来越多的高校开始考虑将数据挖掘技术应用到网络教学平台中,通过对学生点击访问教学平台的数据进行分析和挖掘,对学生学习方式、学习态度、知识的把握度、学习反馈等有了科学的了解,对今后的教学改革、课程设置、教学平台设置等工作提供了决策支持。

(一)数据挖掘定义

数据挖掘是一门新兴的学科,它主要是面向决策支持,为决策者提供有价值的信息。数据挖掘又是一个交叉性的科学领域,涉及数据库技术、统计学理论、机器学习技术、模式识别技术、可视化理论和技术等。有人从商业角度将数据挖掘(Data Mining)定义为:数据挖掘是一种新的商业信息处理技术,其主要特点是对大型商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中挖掘出潜在的模式,帮助企业的决策者调整市场策略,减少风险,做出正确的决策。

(二)数据挖掘分类

由于所用的数据挖掘方法不同、所挖掘的数据类型与知识类型不同、数据挖掘应用的不同,从而产生了大量的、各种不同类型的数据挖掘。

1.根据所挖掘数据库类型的不同来分类,可以分为:关系型数据挖掘、对象型数据挖掘、对象-关系型数据挖掘、事务型数据挖掘、数据仓库的数据挖掘。

2.根据所挖掘的知识类型来分类,可以分为:特征化、区分、关联、分类、聚类、孤立点分析(异常数据)和演变分析、偏差分析、相似性分析等分类。

3.根据所采用技术,可以分为:自动数据挖掘、证实驱动挖掘、发现挖掘和交互式数据挖掘。

4.根据数据挖掘应用来划分,可以分为:金融数据的数据弯角、电信行业的数据挖掘、DNA序列数据挖掘、股票市场数据挖掘、WWW数据挖掘等。

不同的应用通常需要集成对于该应用特别有效果的方法,因此,普通的、全功能的数据挖掘并不一定适合特定领域的数据挖掘任务。

(三)数据挖掘所能发现的知识

1.广义型知识,反映同类事物共同性质的知识;

2.特征型知识,反映事物各方面的特征知识;

3.差异型知识,反映不同事物之间属性差别的知识;

4.关联型知识,反映事物之间依赖或关联的知识;

5.预测型知识,根据历史的和当前的数据推测未来数据;

6.偏离型知识,揭示事物偏离常规的异常现象。

三、基于数据挖掘技术的网络教学平台的设计与实现

(一)解决方案

数据挖掘是一种决策支持过程,是深层次的数据信息分析方法,将数据挖掘技术应用于网络教学平台,对学生的学习方式进行分析,无疑是非常有益的,它可以全面的分析出学习结果与各种因素之间隐藏的内在联系,例如,经过分析,可以得出“什么样的知识描述方式是学生最喜欢的”等类似问题的答案,这是传统的网络教学平台无法具备的。

数据挖掘技术在网络教学平台中的应用,大致可以分析以下七个步骤:

图1:数据挖掘的步骤

(二)设计原则

基于数据挖掘技术的网络教学平台,不同于商业网站、企业网站等其他类型的网络平台,它主要面对的是学生和教师,其浏览网站的目的主要是进行学习、教学资源和信息查询以及师生交互。面对这样群体的需要,设计应遵循以下原则:

1.实现网络辅助教学功能的原则

2.以学生为中心原则

3.交互性原则

4.以人为本原则

5.科学性原则

6.教学设计原则

7.便于数据挖掘的原则

(三)方案实施细则

1.确定挖掘对象及目标。通过学生访问网络教学平台的时间、最常点击的栏目和知识点、下载量最大的内容、网上测验的成绩,挖掘出学生对教学平台使用的反馈,包括时间、知识点、内容、表达形式、测验结果,并用所获得的分析结果指导网络教学平台的改进和课程、上课形式的改革。

2.模型的选定。分析学生对网络教学平台的使用情况,首先找出所有的频繁项集,这些项集出现的频繁行至少和预定义的最小支持度一样,然后由频繁项集产生关联规则,这些规则必须满足最小支持度和最小可信度。

3.数据采集。基于分析的数据是学生对网络教学平台的使用情况,所以我们的数据采集主要来源是网站的访问信息,包括访问时间、时间的长短、知识点的点击率、下载率、题库的使用率。

4.数据预处理。首先将来自多个数据源的数据合并集合在一起,然后使用一定的规则填补遗漏的数据值。

5.数据转换。将选取的数据转换成一个分析模型,建立一个真正适合挖掘算法的分析模型,不同的挖掘算法采用不同的分析数据模型。

6.分类挖掘知识和信息。使用适当的程序设计语言来实现分析数据模型,在净化和转换过的数据集上进行挖掘,得到有用的信息。

7.知识的表示和应用。将数据挖掘得到的分析信息进行解释和评价,生成分类规则呈现出来,然后将规则应用到网络教学平台的改进和课程的改革中,以提高教学质量。

四、总结与展望

数据挖掘迄今为止,一直较多用于银行金融等经济领域,通过数据挖掘,能自动在大量数据里找寻潜在的预测信息,用于发现客户新的需要等。与此类似,数据挖掘对高校的网络教学平台有着非常直接的应用关系。

利用数据挖掘技术,能够分析出学生最常在什么时间段访问教学平台,从而可以安排任课教师在网络上与学生进行互动、交流;利用数据挖掘技术,能够发现学生对课程中知识点的访问频率,从而得出对课程的掌握情况,更加便于提高教师今后的教学质量;利用数据挖掘技术,能够挖掘出学生对网络教学平台表现形式的接受程度,某一些课程,教学平台的设计者理所当然的认为文字、图片、PPT等形式是学生最为容易接受的,然而通过数据挖掘,却发现动画表达形式才最为受学生欢迎。而某一些课程,以练习题的方式对知识点进行巩固和阐述,则是学生最为喜欢的方式;

由于网络教学平台是现今高校推进教学改革、提高教学质量的通用软件,而且各高校、各课程的网络教学平台具有极大的相似性,因此,在高校网络教学平台中注入数据挖掘技术具有相当大的可操作性。此外,基于数据挖掘的网络教学平台也需要在今后的使用和升级过程中进一步的完善和解决更多的技术性问题。如何进一步应用数据挖掘技术,为高校的教学、发展、改革提供更强大的决策支持,这也是未来需要深入研究的方向。

参考文献:

[1]徐春绵.浅谈教学网站的设计[J].中国科技信息,2007,22

[2]王光翔.数据仓库技术在招生决策系统中的应用[J].贵州大学学报(自然科学版),2006,11,23(4):389-391

数据挖掘课程第6篇

关键词:数据挖掘; 延期毕业

中图分类号:TP311.13 文献标识码:A 文章编号:1006-3315(2012)04-135-001

一、数据挖掘技术

数据挖掘就是从海量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐藏在其中人们事先不知道的但又有潜在有用的信息和知识的过程。数据挖掘技术要完成不仅是面向一般数据库的简单查询工作,而且要对这些数据进行统计、分析、综合和推理,得到有用的信息,以指导实际问题的求解.发现事件间的相互关联。甚至利用已有的数据对未来的活动进行预测。数据挖掘是一门交叉学科,涉及数据库、数理统计、人工智能、可视化、并行计算等方面的技术。数据挖掘技术从产生以来,已经被应用于多种领域,并得到了充分的验证,显示了其重要的经济价值,同时在应用过程中得到不断的完善和进步。

二、数据挖掘在电大学员数据中的应用

1.数据仓库的建立

1.1数据仓库主题的分析。建立数据仓库和进行数据预处理是进行数据挖掘的数据准备.它的任务是为数据挖掘提供合适的数据。经过分析,我们可以发现要学员延期毕业有以下几个方面原因:专业的因素;课程的因素;考试的因素。数据仓库所要实现的系统功能包括:数据仓库可以帮助制定招生策略:还可以对学员平时的学习提供一些有效的建议,提高毕业率。

1.2数据仓库模型设计。对“学员延期毕业”主题进行模式划分。采用星型架构设计出下面的事实表和各维表:

1.2.1事实表设计:事实表名称、学员成绩事实表

索引字段:学号、课程代码、班代码、专业代码、学年学期号

度量值:成绩、学分

1.2.2维度表设计:

1.2.2.1学员维度表名称:学员信息

学员维度表结构:学号、姓名、班代码、单位代码、性别、年级、身份证号、籍贯、学籍状态、专业代码、职业

1.2.2.2班级维度表名称:班级信息

班级维度表结构:班代码、班级名称、专业代码、毕业学分、补专学分、年限、必修学分、限选学分、选修学分

1.2.2.3专业维度表名称:专业信息

专业维度表结构:专业代码、专业名称、本专科

1.2.2.4课程维度表名称:课程信息

课程维度表结构:课程代码、课程名称、学分、学时、开设学期、性质

1.2.2.5时间维度设计:时问维度表名称、学年学期时间维度表结构:学年学期号、学年、学期

1.2.2.6考试考勤维度设计:考试考勤维度表名称、考勤信息

考勤维度表结构:学号、课程代码、考勤时间、考勤结果

2.系统的实现

首先,将源数据(学员、班级、专业、课程等相关数据)经过抽取、转换、加载存储到SQL Server数据库中,SQL Server的DTS工具可以完成大部分数据的转换和清理工作,这样不同源数据就可以统一有序地存储在服务器端的SQL Server数据库中,为数据挖掘做好数据准备。其次,利用某种高级语言实现数据挖掘算法,编制相应的外挂数据挖掘模块。最后与服务器上的数据库进行数据交互。在这种利用外挂模块实现数据挖掘的方案中,不同的数据库的访问技术有所不同,微软公司主要的数据访问方法是ADO,它是一个简单的对象模型,在应用程序中使用该模型可以方便地与SQL Server数据库进行数据交互。

3.数据挖掘试验结果分析

本文随机选取了20名学员的数据作为样本数据,对数据进行离散化等一系列处理以后得到最终决策树。

从决策树中,可以方便地得出以下规则以供决策参考:

3.1若课程不及格比例

3.2若考勤为差则会延期毕业;

3.3若课程不及格比例>50%且考勤为一般且年龄在20~30的公司职员则不会延期毕业。

3.4若课程不及格比例≥50%且考勤为一般且年龄在30~40的干部,则会延期。

从上述规则中,可以很直接地看到在延期毕业这个问题上考试考勤是一个非常值得关注的原因,一般考试不能正常来的学员都会延期毕业;平时考勤好且课程不及格比例小于50%的,一般都会如期毕业;而课程不及格超过50%的学员,虽然考勤为良,但是由于年龄和工作的关系,也会延期。

三、结束语

把数据仓库和数据挖掘技术应用于电大开放教育,通过需求分析确立主题,利用电大开放教育数据库中已有的数据进行整合建立电大开放教育数据仓库,并利用粗糙集挖掘出一定的规则,生成对开放教育有效的决策规则,并对规则进行分析,最后利用一组随机数据验证了决策规则的有效性。

参考文献:

数据挖掘课程第7篇

关键词:数据挖掘技术;成绩管理

一、数据挖掘的定义

数据挖掘是一个涉及多学科交叉的研究领域,综合了人工智能、机器学习、数理统计等学科,它把对数据的应用从较低层次的简单的查询提升到从数据中挖掘知识。简单的说,数据挖掘就是从数据中获取知识。从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道、但又是潜在有用的信息和知识的过程。数据挖掘应该更正确地命名为“从数据中挖掘知识”。

二、数据挖掘的过程

数据挖掘过程大概可以概括为三部分:数据准备、数据挖掘、结果的表达和解释。如图1-1。

三、数据挖掘的特点

数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识,所得到的信息具有事先未知、有效、实用三个特征;用户不必提出明确的要求,系统能够根据数据本身的规律性,自动地挖掘数据潜在的模式,或通过分析建立新的业务模型,帮助决策者调整市场策略,这有利于发现未知的事物。因此,它是由数据驱动的一种真正的知识发现方法。

四、学生成绩管理的现状

随着高校招生规模的扩大使成绩管理处理的数据量急剧增加,存放在数据库中的大量的成绩数据,对于一般的查询过程是有效的,管理人员能够通过简单的统计或排序等功能获得一些表面的信息,但随着数据库中存储的数据量的增大,传统的数据库管理系统的数据管理和处理功能就不能满足现实的需要,因为无论是查询、排序还是方差,其处理方式都是对指定的数据进行简单的数字处理,对于学生成绩管理方面,往往只能做一些简单的功能,由于大量数据以不同的形式存储在不同的计算机上,从而使隐藏在其中的大量有用信息无法得到有效的利用,无法发现数据中存在的关联和规则,无法根据现有的数据预测未来的发展趋势。上述问题直接导致教学管理部门无法进行有效的评估,任课教师无法进行有效的教学方法改进。而如何将这些数据信息转化为知识表示,为学校管理者提供决策依据,科学指导教学,提高教学管理水平,将是高校需要迫切解决的问题。

五、将数据挖掘技术在成绩管理中的应用

1、学生成绩分析方面

学生的学习成绩是评估学生表现好坏的重要依据,也是学生是否掌握好所学知识的重要标志,目前高校使用的成绩管理系统大部分只能做一些简单的数据管理和处理,例如:学生的平时成绩输入、考试成绩输入、毕业设计成绩登记,进行各类统计报表和信息查询、分析某一个班学生学习成绩分布的情况等。目前大量的成绩数据只是简单地存储在数据库中,隐藏在这些数据中的潜在信息被闲置,没能被充分利用。在数据库中学生成绩分析从定性的角度考虑不是很精确,而数据挖掘是从定量的角度精确地分析学生成绩分析的各个方面数据。

2、在考试方面

考试是对教师教学效果和学生学习效果的一个检验,是教学中必不可少的环节,虽然按考试成绩可以总体评价在一定时期内学生取得的成绩,但这并不能有效地说明成绩的高低与哪些因素有关,无法知道教师教学环节中的成功与不足之处,对教师教学方法的改进和学生学习成绩的提高都没有实际意义上的帮助,而且,学生考试成绩的高低也与试题的质量有着很大的关系,因此探索有效的方法来评价试题的质量如试题难易度,知识点全面度等在实际的教学过程中同样具有重要的意义。将数据挖掘技术应用于试卷分析数据库中,然后根据学生得分情况分析出每道题的难易度、区分度、相关度等指标,那么据此,教师可以对试题的质量作出比较准确的评价,进而可以用来检查自己的教学情况及学生的掌握情况,并为今后的教学提供指导。

2、在教学评价方面

教学评价是教学中的一个重要环节,是引导教育、培养高素质人才,帮助社会充分利用教育成果和促进教育健康发展的保证。传统的教学评价大多是参考相关评价指标体系和调查问卷等方式实施的,而且更是注重评价的结果,以作为教师晋升、学生评优等的依据.高校每学期都要搞课堂教学评价调查,积累了大量的教学信息数据,利用数据挖掘技术,从教学评价数据中进行数据挖掘,探讨教学效果的好坏与教师的年龄、职称之间有无必然的联系,课堂教学效果与教师整体素质关系如何,合理配备班级的上课教师,使学生能够较好的保持良好的学习态度,从而为教学部门提供了决策支持信息,促使更好地开展教学工作,提高教学质量。

3、选择教师的教学方法方面

在教学过程中,教师可以采用多种方法来完成自己的教学任务,比如讲授法、多媒体演示、分组讨论法、课程实习法等,在通常情况下,一般可以采取一种或几种方法进行.据此可用数据挖掘的方法来挖掘数据库中的数据,判定下一步应采取什么样的教学方法,以满足教学的需要,更有利于学生对知识的吸收。

4、课程的合理设置方面

在学校,学生的课堂学习是循序渐进的,而且课程之间有一定的关联与前后顺序关系,在学一门较高级课程之前必须先修一些先行课程,如果先行课程没有学好,势必会影响后续课程的学习,此外,每一学期安排课程的多少,也会影响学生的学习效果。利用学校教务管理系统中存放的历届学生各门学科的考试成绩,结合数据挖掘技术的相关功能,得出一些有价值的规则和信息,最终找到影响学生成绩的原因,在些基础上,对课程设置做出合理安排。

六、结束语

随着我国各高校管理信息化的不断推进,各类学校的数据库建设不断完善,在学校平时的教育教学管理中累积了大量的数据。在这些海量的数据中,隐藏着大量有用的知识,如果利用好这些知识,将能够对学校的教育教学工作起到积极的指导作用。数据挖掘技术正是为了解决如何从海量数据中挖掘出有用的知识,因此,将数据挖掘技术应用到高校的教育教学中去是非常有必要的。

参考文献:

【1】吉根林,帅克,孙志挥.数据挖掘技术及其应用.南京师大学报(自然科学版),2000,23(2):25-27

【2】李庆香.数据挖掘技术在高校学生成绩分析中的应用研究:硕士学位论文.重庆:西南大学教育技术系,2009

数据挖掘课程第8篇

【关键词】数据挖掘 发展经济学 教学质量

【中图分类号】G642.0 【文献标识码】A 【文章编号】1009-9646(2008)09(b)-0043-02

发展经济学课程体系庞大、理论丰富、学派林立,表现为海量的、模糊的、随机的信息。如何在教学中改进和创新本课程的教学模式,提高教学质量一直是从事本课程教学的教师所面临的主要问题之一。本文应用数据挖掘技术对这些信息进行量化、分析、处理,以便对教学质量监测系统更加科学、客观的设计、控制和评价,实观对教学质量监测系统的优化,进一步提高教学质量。

1 发展经济学教学中面临的困境

由于教材、开设时间、教授方法、教师水平等诸多原因,发展经济学教学一度停留在“浅显易懂”的范围内,具体表现在以下几个方面:

1.1 教师方面

首先,教师专业结构不合理。多数发展经济学教师是在其所学经济学相关课程,如政治经济学、经济史以及经济思想史等的基础上开始自我学习和提高的,所以未经过发展经济学系统学习和训练。其次,教学方式的效果并不理想。大多数高校的发展经济学课程所采用的授课方式仍然是以任课教师的课堂讲授为主,也有少数教师采取专题讲座和案例讨论方式的,教学中,教师把备课、教学的重点及主要精力用在了概念的界定、逻辑推理和追求理论体系的逻辑性、完整性上,而较少关注经济现象的变化及学生关心的实际问题,这就很难引起学生的共鸣。

1.2 学生方面

在教学过程中,一方面由于学生的基础不同、领悟程度不同;另一方面一些学生学习态度不端正;再加上大班化授课,人数多,间接带来学生上课纪律不好,存在迟到早退乃至旷课现象,不认真听课及做作业,严重影响课堂教学效果和质量。

就学生的专业基础而言,大学四年级是最佳学习时机。但是,发展经济学课程的教学和学习需要安排充裕的时间,而大学四年级的课程安排一般很少,专业课程的教学已经结束,其原因在于,大学四年级学生必须参加社会实习、撰写毕业论文、寻找工作单位和研究生入学考试,这些事需要花费大量时间和精力。如果在这一阶段还有发展经济学的课程教学显然是不合适的。这便出现了学生专业基础与发展经济学教学时间安排上的矛盾。

1.3 教材方面

教材的内容过于陈旧,目前国内高校使用的发展经济学教材的主要内容多年不变,有的发展理论、经济发展政策己与当代先进的理论、政策明显不符,也与我国经济发展现实不合。发展经济学的内容在不断地更新和发展,我国对发展经济学的理论研究已经达到相当高的水平,我国经济实践中也积累了相当多的经验,但教材建设远远没有跟上理论研究和实践发展的步伐。

2 在提高发展经济学教学质量中的数据挖掘

本文结合数据挖掘技术,分析提高发展经济学教学质量途径。数据挖掘流程可分为四个模块:数据收集模块、数据处理模块、数据挖掘模块和数据表示应用模块[1]。如图1所示:

2.1 数据收集模块

在学校的各部门中积累了大量的影响发展经济学教学质量的数据,这些数据分散在人事处、学生处、教务处、科研处等各个部门除了利用这些已有数据,还必须把更多的因素考虑在内。包括:(1)教学过程中教师教学方法、教学内容、教学设计、教学态度和教学效果;(2)教师的学历、职称、培训经历、现代教育观和信息意识等。

2.2 数据处理模块

数据处理模块处理的信息包括:解决语义模糊性,数据库按照元数据标准对数据进行清理、集成和变换,检查数据的完整性和一致性,将数据整合成能被采掘算法利用的数据,最后存入数据采样库。

2.3 数据挖掘模块

数据挖掘模块:在友好的导航界面引导下,使用合适的算法通过关联分析、分类分析、聚类分析和序列模式分析对经过处理、转化的数据,进行挖掘、分析处理,得出结果并输出给数据表示与应用模块。

2.3.1 教师信息的挖掘

从以下几个方面对教师的信息进行挖掘:(1)课堂教学信息挖掘:通过对教师、学生的分类分析、关联分析找出数据间中隐藏的关联网。根据教师、学生的行为占有率、行为转换率得出本节课的教学模式图。(2)对教师教学风格、特点的信息挖掘:包括对教师语言特点、提问的比率、提问的开放性程度、与学生的互动能力等主观性因素进行量化,可视化。

2.3.2 学生信息的挖掘

从以下几个方面对学生的课堂行为表现进行挖掘:(1)思维状态:看学生是否对教师的提问,提示信息作出积极的反馈;学生是否主动提出问题、发表见解。(2)交往状态:一看课堂上是否有多边、丰富、多样的信息联系与信息反馈,二看课堂上的人际交往是否有良好的合作氛围。

2.4 数据表达和应用模块

2.4.1 数据表达。挖掘发现的知识可以利用可视化技术,如树、表、规则、图表、交叉表、矩阵或曲线等多种形式表示,使内容易于理解能够直接被人们使用。

2.4.2 数据应用。数据挖掘在教学质量监测系统中的应用主要有以下几个方面:

(1)个性化学习。1)学习者特征的可知性分析。根据学生的注册信息和需求纪录,系统可以向学生显示那此可能引起学生特殊兴趣的新知识。2)分析需求趋势。分析每个学习者的访问模式,通过挖掘对应的访问历史记录,系统向不同的学生提供符合其访问习惯的页面信息,预测学习需求。(2)自动答疑系统。系统解答与对学生提交的问题是同步并发的过程,用户在页面输入提出的问题,提交给计算机处理,系统对输入的问题进行分词和提取关键字的预处理。(3)教学评价和学习结果评价。教学效果和学习结果都需要一个客观公正的评价,数据挖掘可以帮助实现多方面,多层次、全方位的评价。

参考文献

[1] J.Han and M .Kamber 著.范明,孟小峰译.数据挖掘:概念与技术[M].机械工业出版社,2004.

[2] 谭祖谊.发展经济学教学模式改革初探,中国青年政治学院学报,2005,(5):93-96.