资源预览内容
第1页 / 共15页
第2页 / 共15页
第3页 / 共15页
第4页 / 共15页
第5页 / 共15页
第6页 / 共15页
第7页 / 共15页
第8页 / 共15页
第9页 / 共15页
第10页 / 共15页
亲,该文档总共15页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
数据仓库技术在学生成绩管理中的应用 摘要:本论文介绍了数据仓库、数据挖掘等基本概念性知识。在设计中通过将搜集来的学生成绩原始数据进行清理、集成、变换等方法进行数据预处理后,建立学生成绩管理数据仓库,应用SQL Server 2008中的联机分析处理技术从不同的维度分析各种数据,建立决策树挖掘模型对学生成绩进行定性分析,并对实验结果进行了分析和解释.关键词:数据仓库,数据挖掘,维度,学籍管理The Application of Data Warehouse Technology in the Management of StudentsAbstract: This paper mainly introduce the data warehouse and data mining, and other basic conceptual knowledge。 In the design of collected by the student achievement original data cleaning, integration, transform method for data pretreatment, set up students performance management data warehouse application SQL Server 2008 of online analytical processing technology from different dimensions to observe whether grades have influence factors, establish decision-making tree mining model student achievement of qualitative analysis, and the experimental results are analyzed and explained, used to guide the school the decision makers to make change the talent training scheme and guide students to learn more effectively。Key words: data warehouse,data mining, dimension, schoolmanagement目 录1 引言11。1 数据仓库的研究现状及发展趋势11.2 数据挖掘技术在教育领域中的研究现状及意义21.3 研究内容32 数据仓库的数据组织32.1 数据仓库32。2 数据仓库的特点32。3 学生成绩数据库的实施42.4 学生成绩数据仓库的概念模型设计42。5 学生成绩数据仓库的逻辑模型设计53 数据预处理104 数据仓库的建设与的分析;114.1 OLAP的概念114。2 OLAP的特性114.3 OLAP的基本活动124。4 OLAP的实现方式125 数据挖掘135。1 数据挖掘的概念135。2 数据挖掘的任务145.3学生成绩的多维分析145.4 进行多维分析176 结论19第II页1 引言如今人们利用信息技术生产和收集大量的数据,给我们的生活提供了很大的方便。然而要想高效地管理、组织这些数据并对其进行分析并不是一件易事.数据仓库和数据挖掘技术在这方面得到了广泛的应用,数据挖掘能从存放在数据仓库中的大量数据中挖掘出隐藏的有用知识。高校中存在着学籍管理、成绩管理等各种数据系统。在这些数据库中存储了大量的数据,学生成绩不仅对学生的学习效果和教师的教学效果具有检测作用,而且还能反馈教学活动,反作用于教师的教和学生的学。在诸多高校的教务数据仓库中的学生成绩记录非常庞大,一般分为定量评价和定性评价.定量评价也就是我们平时所说的某门课程考了多少分,而定性评价一般分优、良、中、差等四个级别。数据库是从定性的角度分析学生成绩,缺点就是得到的结果不是很精确;而数据仓库是从定量的角度对学生成绩进行分析,能精确的得到各个方面的数据。因此使用数据仓库和数据挖掘技术对学生成绩进行深层的分析,挖掘出隐藏在数据背后的规律或模式,根据挖掘结构提出一些指导性建议从而更好的指导教师教学,提高教学效率,提高学生的成绩。本文利用数据挖掘技术,以我校教务管理系统为研究背景,从教务处网站导出近几年的学生成绩和教师、课程等各方面的信息数据,然后建立学生成绩数据仓库,并创建多维数据集和维度结构,从不同的维度观察学生的成绩,得出一些对比性数据。最后应用数据挖掘技术对学生成绩进行挖掘,得出定性评价,根据这些挖掘结果有针对性的提出一些改进教学质量和提高学生成绩的措施。1。1 数据仓库的研究现状及发展趋势 数据仓库技术是 20世纪90 年代的一门新兴技术,它能有效地管理好数据,并对其进行存储和组织。目前,数据仓库还没有一个统一的定义,著名的数据仓库专家W。H.Inmon对数据仓库概念有比较系统和全面的解释,他在其著作Building the Data Warehouse一书中指出:数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(NonVolatile)、反映历史变化(Time Variant)的数据集合,它广泛应用于支持管理决策。显而易见数据仓库不仅仅是一个数据集合,还是一个决策支持系统。目前,国外企业所建立的数据仓库应用系统给他们都带来了明显的经济效益,但是金融业使用数据仓库只是完成简单的报表生成和日常业务分析,并没有对数据进行深入的挖掘分析,显然这样没有发挥出数据仓库的应用价值,所以并不能给银行等金融业带来真正的经济效益.现阶段我国的数据仓库分析技术还没有多少经验.使用数据仓库的关键是建立仓库模型 ,这就对设计者提出了要求,他们必须对相关的业务非常熟悉而且还应具备相应的管理分析能力 。数据仓库是一个很有发展前景的技术。数据仓库技术包括对数据的抽取、存储与管理、数据表现和方法论等方面。首先,要采用统一的数据结构即要统一信息系统的平台。数据仓库技术未来的发展趋势:在数据抽取方面,将会在系统集成化方面得到飞速的发展;在数据管理方面,数据库厂商将产生出数据仓库引擎,与数据库服务器同步发展;在数据表现方面,数理统计的算法和功能将应用到联机分析产品中。当数据模型建好以后,就要在其上建立应用系统,进而在数据仓库上进行数据挖掘,构建决策支持系统 ,让所建的数据仓库发挥其有用的作用.1。2 数据挖掘技术在教育领域中的研究现状及意义随着国家对教育的重视,学校也开始寻找各种可以提高学生成绩的途径。根据不同考试的要求,找出学生的考试成绩中潜在的联系已成为各级高校和教育部门的需求。把数据挖掘技术应用到教育领域,通过对数据库中的大量数据(特别是学生的成绩数据)进行抽取、转换,从中提取出对教学质量的改进有作用的数据。当前,数据挖掘技术在教育领域中的应用主要有以下几个方面:(1)教学管理系统方面.把数据挖掘技术应用到教学管理中,建立教学管理挖掘系统,对其中的数据进行分析能得到传统的分析方法无法得到的潜在信息,因此学校可以利用这些信息知道教学的进程从而提高教学质量.(2)高校教学质量评估方面。通过对某一个院系学生的评价数据和授课教师的信息进行数据挖掘,采用分类、聚类、决策树、关联规则等数据挖掘方法对学生成绩进行挖掘,对挖掘结果进行分析,得出定性评价,找出影响教学质量的关键因素,为教学提供决策支持。(3)网络教学方面.把数据挖掘技术应用到网络教学方面,对教学信息数据进行挖掘,产生有利于提高网络教学质量的信息点,使得网络教学工作得到顺利开展。数据挖掘技术中的关联规则可以发现两门或多门课程中存在的先行后续的关系,学生成绩与课程设置顺序之间存在的联系,从中可以找到影响学生成绩的原因。1。3 研究内容在明确了我校教学管理系统的不足之后,试图将数据仓库和数据挖掘技术应用到教学管理中,首先对教学系统中大量的学生成绩数据进行分析和处理,利用SQL Server 2008软件中的挖掘算法以学生成绩为核心挖掘潜在的规律及模式,得到影响学生成绩可能原因,有针对性地提出教学建议和课程安排次序,以帮助教育者制定教学计划,提高教学质量。本文主要介绍了数据仓库、数据挖掘等基本理论知识和关联规则、聚类分析等基本算法;运用联机分析处理技术和决策树算法应用于所建立的学生成绩数据仓库中,对学生成绩进行深入挖掘,从教师、学生、课程等三个维度分析出学生成绩的规律性变化。 2 数据仓库的数据组织2。1 数据仓库 如今数据库中存有大量的数据信息,必须对其进行存储、管理和维护,由于数据库管理系统的局限性使得它很难满足人们的需求.DBMS的缺陷主要表现为:数据量成几何级数增长;数据来源不同的数据难以集成;访问这些数据时的响应性能不断降低。而应用决策支持系统,它所需的数据必须经过提取、转换、过滤等预处理操作并与其他数据源整合,按主题存放在数据库中.客户查询时访问的是中央数据库,因此要想使数据能更好地为用户服务,必须经过清洗、转换和加载。这些工作通常都在数据仓库中完成。2。2 数据仓库的特点 数据仓库主要有四个特征:面向主题性、集成性、不可更新性、随时间变化性。(1)数据仓库是面向主题的以前的操作型数据库中侧重的是联机事务,各项数据的应用逻辑是相互组合的,分离度不高。数据仓库中的数据由于是面向主题进行组织的,所以能完整地刻画各项数据以及数据之间的关系.(2)数据仓库中的数据是集成的数据仓库中的数据大多数都是来自不同的外部应用系统或者是本系统中不同的使用部门.我们一般把数据仓库中的数据分为外部数据和内部数据,外部应用系统的信息就叫外部数据,本系统中的信息就叫内部数据。这些内外数据的组织结构会有所不同,这就需要对不同的数据源数据进行集成,目的是为了保持数据的一致性.我们所说的数据集成并不是对数据的简单归类于合并,而是要经过数据组织结构的统一与综合。(3)数据仓库中的数据是不可更新的 数据仓库中的数据记录的是日积月累的历史数据的内容,反映的是不同时间点的数据库快照集合通过数据的统计、整合和重组而得出的数据。数据仓库数据的不可更新性并不意味着不可以对数据进行更新操作。当我们要进行新的分析决策时,这时候就需要对数据进行更新操作,把数据仓库中那些过时的数据删掉,并将近期的数据进行集成整合然后添加到数据库中进而生成新的记录.这些修改和重组的任务是由数据仓库管理员定期后台实现的,最终用户不允许参与。2.3 学生成绩数据库的实施新建一个数据库,命名为“学生成绩,然后根据前面的数据结构设计部分所设计的11个表结构建立各表,如图4。1所示:图2。1 数据库模型2.4 学生成绩数据仓库的概念模型设计概念模型设计阶段首先要界定系统边界和主要的研究内容.经过了解现今许多高校在学生成绩数据库中对学生成绩仅仅是存储、查询等简单的操作,因此教师要想了解某一门课程的信息并不是一件简单的事。教师希望从学生的考试成绩中知道用哪种教学方法或手段会对学生的学习积极性得到提高,收到比较好的教学效果.还有学生学习这门课程会不会影响对另一门课程的学习,应该怎样安排课程的先后顺序才能让学生学的更好。在学生成绩管理中有各种类型的的数据,先要对这些数据进行预处理,使它们符合教学决策所需的数据。然后把学生成绩分析作为本论文研究的主题创建学生成绩数据仓库.并从同一个班的不同门课程和同门课程在不同的专业与不同的教师教授下
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号