基于DW的成绩评定系统设计_软件工程硕士论文.doc

上传人:来看看 文档编号:3920509 上传时间:2019-10-10 格式:DOC 页数:66 大小:1.22MB
返回 下载 相关 举报
基于DW的成绩评定系统设计_软件工程硕士论文.doc_第1页
第1页 / 共66页
基于DW的成绩评定系统设计_软件工程硕士论文.doc_第2页
第2页 / 共66页
基于DW的成绩评定系统设计_软件工程硕士论文.doc_第3页
第3页 / 共66页
基于DW的成绩评定系统设计_软件工程硕士论文.doc_第4页
第4页 / 共66页
基于DW的成绩评定系统设计_软件工程硕士论文.doc_第5页
第5页 / 共66页
点击查看更多>>
资源描述

《基于DW的成绩评定系统设计_软件工程硕士论文.doc》由会员分享,可在线阅读,更多相关《基于DW的成绩评定系统设计_软件工程硕士论文.doc(66页珍藏版)》请在三一文库上搜索。

1、基于DW的成绩评定系统设计第一章 设计思想概述“基于DW的成绩评定系统”为了进行教育质量评定,这就要保存历次考试成绩,以供系统进行查询比较分析。所以我们将参考数据仓库的设计。数据仓库就是面向主题的、集成的、不可更新的(稳定性)随时间不断变化(不同时间)的数据集合,用以支持经营管理中的决策制定过程。它有如下三个特征:1. 面向主题性。数据仓库中的数据是面向主题的,它与传统数据库中的面向应用相对应。数据仓库的主题是一个在较高层次上将数据归类的标准,每一个主题对应一个宏观的分析领域。2. 集成性。数据仓库的集成特性是指在数据进入数据仓库之前,必须经过数据加工和集成,这是建立数据仓库的关键步骤。它能够

2、统一原始数据中的矛盾之处,还能够将原始数据结构从面向应用向面向主题转变。稳定性。数据仓库的稳定性是指数据仓库反映的是历史数据的内容,而不是日常事务处理产生的数据,数据经加工和集成进入数据仓库后是极少或根本不修改的。这点注意要区别的是,数据仓库是不同时间的数据集合,它要求数据仓库中的数据保存时限能满足进行决策分析的需要,而且数据仓库中的数据都要标明该数据的时间属性。第二章 需求分析基于DW的成绩评定系统是针对我国素质教育改革(特别是当前教育评价改革)中出现的难题而提出的,当前学校特别是中小学还靠着学生考试成绩为主要评价方式。如何紧密结合当前学校实际进行管理,对教育改革的成功有着重要的意义。2.1

3、 需求捕获工作流2.1.1 需求概述基于DW的成绩评定系统是针对我国素质教育改革(特别是当前教育评价改革)中出现的难题而提出的,当前学校特别是中小学还靠着学生考试成绩为主要评价方式。如何紧密结合当前学校实际进行管理,对教育改革的成功有着重要的意义。关键用户需要是:l 能根据历次统考成绩分析各班级各科各任课教师的成绩进步情况,为评定教师教学质量提供精确数据。l 能从历次成绩数据分析学生、教师存在的问题,找出改进教学质量的方向。2.1.2 需求分析1、系统环境基于DW的成绩评定系统除了常规的成绩管理功能外,关键是能历次统考成绩分析各班级各科各任课教师的成绩进步情况,为评定教师教学质量提供精确数据。

4、2、功能需求功能特性是给用户带来利益所必需的高级系统性能。基于DW的成绩评定系统的功能有(1)登录系统(2)管理教师信息(3)管理学生信息(4)管理学科信息(4)管理班课程(5)新建考试项目(6)录入成绩(7)汇总成绩(8)查询成绩录入的成绩是原始分,保存在数据库中还采用T标准分和百分等级。原始分是指在一次考试后,从试卷的卷面上直接得到的分数。原始分反映了考生答对题目的个数,或作答正确的程度。在常态分布情况下,一个学生的成绩在分布中处于什么位置,还可以通过百分等级和标准分数来分析。百分等级反映的是某个观测分数以下数据个数占总个数的比例的百分数,是应用最广的表示测验分数的方法。公式如下所示: (

5、不分组)其中,Pr为百分等级;N为总人数; Fb为小于该分数的向上积累次数。因此,85的百分等级表示在常模样本中有85%的人比这个分数要低。换句话说,百分等级指出的是个体在常模团体中所处的位置,百分等级越低,个体所处的位置越低。T标准分是以标准差为单位表示测验成绩与平均分数之间的距离。公式如下所示: 其中,X为原始分,50为标准分的平均分,10为转换为标准分后的标准差;为原始分的平均分,其公式为: ;S为标准差,(样本)标准差的公式为: 。标准差能反映一个数据集的离散程度。因此,标准差也是一种平均数。标准差大表示考生分数分布比较分散,分数距离拉得比较大。T标准分以百分等级可以应用在:l 查看学

6、生各科的标准分,可以看出该生各科的相对名次、偏科情况。l 比较同一科历次考试的标准分,形成成长曲线,可以较准确地看出该生的进步情况。注意,标准分数使用是基于常模数据服从正态分布的假设。在实际测试过程中,很可能碰到常模团体的测验分数严重偏态,这种情况下若要直接使用上述的标准分数体系来建立常模就不大妥当。3、用例视图用例规约说明:(1)登录系统(System Login)用例1.简要说明目前只是单机系统,只有一个用户:教务管理员用户。必须提供有效的 ID 和口令才能进入系统。2.事件流当主角双击系统图标时,本用例开始。3.基本流-登录系统a) 教务员双击系统图标。b) 系统会显示“请输入系统密码“

7、对话框。c) 教务员输入密码后回车。d) 系统验证密码正确,将进入系统主界面。4.备选流a) 错误密码:如果密码错误,将显示“错误密码”对话框,确定后退出系统。5.前置条件无。(2)修改密码(Change Password)用例1.简要说明系统可以修改登录密码。系统有两个密码,一个是超级管理密码,不向用户公开,不能修改;一个是可以修改的用户密码,保存在数据库中,数据库用超级管理密码加密。2.事件流3.基本流-修改密码a) 教务员选择系统设置菜单中的修改密码选项。b) 系统会显示“更改系统密码”对话框。要求 “输入原密码”、“输入新密码”、“再输入新密码”,单击确定。c) 教务员输入密码后回车。

8、如果原密码不对,或两次新密码不相同,将显示修改无效信息框;如果原密码正确并两次新密码相同,系统将密码保存在数据库。4.备选流a) 无效数据:如果在基本流中系统验证数据格式无效,就会显示一个错误信息。5.前置条件登录:在本用例开始前,主角要登录到系统。(3)管理教师信息(Teachers Manage)用例1.简要说明可新增、修改教师基本信息。2.事件流3.基本流-管理教师信息a) 教务员选择“教师信息管理”。b) 系统会显示“教师信息管理”的表单。里面会加载数据库中全部教师信息。(教师信息中包括教师姓名、组别(如:语文组、数学组、英语组、政史地组、理化生组、综合组)、是否在职等信息,保证教师姓

9、名的唯一性,并且不能变更)c) 教务员对表单内容进行新增、修改(不能删除,可设为非在职)。d) 教务员点击“保存”按钮,系统验证数据无误后,将清空原来数据重新保存到数据库。e) 教务员点击“回到主界面”按钮,系统将关闭“教师信息管理”表单,回到主界面。4.备选流a) 无效数据:如果在基本流中系统验证数据格式无效,就会显示一个错误信息。5.前置条件登录:在本用例开始前,主角要登录到系统。(4)管理学生信息(Students Manage)用例1.简要说明可用Excel界面导入、修改学生信息(学籍管理)。附:应考学生数的确定:以每学年初教务处核定的在籍学生人数为准。下列情况应调增或调减:(1)中途

10、转入、休学后复学、借读后回校的学生取得学籍后不计入该班学生总数,用他们重新入学考试的成绩由教务处核定为优生、优良生、低差生,教务处单独建表记载(中途入学籍或恢复学籍的,“学籍变动时期”可以分辨,“是否计成绩”为“0”),相应计入所到班的对应指标。(2)中途流失学生应计入应考学生(一般每学期开学时办学籍,中途流失的学生指的是还没办好学籍转出的学生,学籍还是“在读”);(3)中途转出、休学、在外借读到其他学校的学生,办理正式手续后,可从应考学生数中扣除(中途转入转出的,“学籍变动时期”都比本期开学日期近,同时,“是否计成绩”改为“不计”); (4)智力残疾学生,凭有关部门的鉴定或批复意见,可从应考

11、学生数中扣除(“是否计成绩”为“不计”);(5)因病不能参加考试的学生,凭县级以上医院证明和书面请假条并经学校审核批准,可从应考学生数中扣除(“是否计成绩”为“不计”)。2.事件流a) 教务员选择“学生学籍管理”。会出现年级的单选列表,教务员再选择相应的年级。b) 系统会显示本年级的“学生学籍管理”的Excel界面表单。里面会加载数据库中相应年级学生信息,如果没有此年级的学生,系统将显示一个空表。(里面包含了学号、年级(只能是13、1424,如“13”级,用单选列表框选择)、班级(只能是数字)、是否计成绩、状态等信息,其中学号保证唯一性,并且不能变更。(状态信息包括正常、毕业、中途转入、休学后

12、复学、借读后回校、中途流失、中途转出、休学、在外借读、智力残疾、病假等状态。来自基本信息数据库,用单选列表框选择)c) 教务员对表单内容进行新增、修改(不能删除,可设为非正常状态)。修改要符合相关规定。(要利用Escel的便宜性)d) 教务员点击“保存”按钮,系统验证数据无误后,再清空原来此年级学生数据重新保存到数据库(学生都保存在“StudentsTable”表中)。e) 教务员点击“回到主界面”按钮,系统将关闭“学生学籍管理”表单,回到主界面。4.备选流a) 无效数据:相应数据必须统一,最好用单选列表选填数据。如果在基本流中系统验证数据格式无效,就会显示一个错误信息。5.前置条件登录:在本

13、用例开始前,主角要登录到系统。(5)基本信息管理(Info Manage)用例1.简要说明可修改一些基本信息,如学科名称(语文、数学、英语、政治、历史、物理、化学、生物、地理)、学生状态(正常、毕业、中途转入、休学后复学、借读后回校、中途流失、中途转出、休学、在外借读、智力残疾、病假)等,这些在填表时都必须统一名称,所以在这里进行设置,填表时就可以用单选列表框。2.事件流a) 教务员选择“基本信息管理”,会再出现“学科名称”、“学生状态”等选项。b) 选择其中,就会出现相应的表单,本显示其数据库中的内容。c) 教务员对其内容进行修改。d) 教务员点击“保存”按钮,系统验证数据无误后,将重新清空

14、数据库中原内容并保存新的。e) 教务员点击“回到主界面”按钮,系统将关闭“基本信息管理”表单,回到主界面。4.备选流a) 无效数据:如果在基本流中系统验证数据格式无效,就会显示一个错误信息。5.前置条件登录:在本用例开始前,主角要登录到系统。(6)管理班课程(Class_Course Manage)用例1.简要说明可设置各班各学科的任课教师。2.事件流a) 教务员选择“设置任课教师”。b) 系统会显示“选择学期”单选列表(只能是1、224,用单选列表框选择)与“选择年级”的单选列表(只能是13、1424,如“13”级,用单选列表框选择)。c) 选择某学期与年级后,系统加载数据库中本学期本年级全

15、部班级已有的任课信息。任课信息表左第一列是班级(班级信息来自学籍数据库),第二列是各个学科(来自基本信息数据库),第三列是这科的任课教师。左方加载教师数据库中在职的教师树型列表,按教研组分组显示。d) 先选择某个班某学科相应的任课教师的空格,再在下方的教师列表中选择相应的教师姓名,任课教师上就变成该教师的姓名。e) 教务员在设置好该学期该年级各班级任课教师后,点击“保存”按钮,系统验证数据无误后,将清空数据中该学期该年级任课信息,再把新信息保存到数据库中(班级任课表ClassCourseTable表有年级、学期、班级、学科、教师等内容,如“13,1,1,语文,张三”),任课教师空的一排忽略不保

16、存。f) 教务员点击“回到主界面”按钮,系统将关闭“学科管理”表单,回到主界面。4.备选流a) 无效数据:如果在基本流中系统验证数据格式无效,就会显示一个错误信息。5.前置条件登录:在本用例开始前,主角要登录到系统,并设置好教师、学科信息,还要有相应的学生班级信息。(7)新建考试项目(Create Test Item)用例1.简要说明教务管理员可以新添加针对统考的考试信息,对考试的属性进行设置。记录本次考试的名称、时间、级别等,主要为成绩记录提供统一时间。2.事件流当主角在主窗体中选择“新建考试项目”时,本用例就开始。3.基本流- 新建考试项目a) 教务管理员选择“新建考试项目”。b) 系统会

17、显示“新建统考项目“表单。c) 教务管理员依次分年级(如:13级建立一个名称)建立以下信息:统考名称、开考日期、年级(只能是13、1424,用单选列表框选择)、学期(只能是1、26,用单选列表框选择)、考试级别(1为校级,2为片区级,3为区级,4为市级,5为省级)。d) 教务管理员输入完成后,点击“完成”按钮。e) 系统验证数据以确保数据格式正确,并在数据库中检验考试项目有无同名。如果数据有效,系统将向数据库中添加相应信息(在数据库中存入考试表Exam)。 f) 系统向数据库添加信息完成后,显示“统考项目已创建完备“提示,此用例结束。4.备选流a) 无效数据:如果在基本流中系统验证数据格式无效

18、,就会显示一个错误信息。主角可以修改信息,重新点击“完成”按钮,系统将重复基本流中的56步。b) 取消操作:在点击“完成”按钮前,主角选择“取消”,此时用例结束。5.前置条件登录:在本用例开始前,主角要登录到系统。(8)录入/修改考试成绩(Input Test Scores)用例1.简要说明教务管理员可以从Excel导入成绩,采用大家熟悉的Excel界面。前提:选择当前已建立的考试项目,就能用Excel界面打开成绩表。已录入成绩的能显示成绩并可以保存更新;新建还没录入成绩的成绩部分为空,可以从其它Excel同结构表中复制成绩并保存。为了数据安全,保存更新时系统要再询问一次并要密码输入正确才执行

19、。(采用Office插件技术)本系统的考试原始分制都为百分制,不是百分制的全部换算成百分制后录入。2.事件流3.基本流- 录入/修改考试成绩a) 教务员选择“录入考试成绩”。会出现统考名称的单选下拉列表,教务员再选择相应的统考名称(来自考试表,选择一个名称也就确定了时间、年级、学期)。b) 显示本年级本次考试各科目的Excel界面表单(先要检查数据库的成绩表,如果有本次成绩,要加载到Excel表上)。左列为学生学号(不是考号,要转换成学籍数据库中统一的学号!要检查与学籍数据库的是否一致!)、姓名(要检查与学籍数据库的是否一致!)、班级(只能是数字,要检查与学籍数据库的是否一致!),右顶为各个学

20、科(来自基本信息数据库),和传统的成绩Excel表一样。c) 教务员将统计好的传统的Excel成绩表(与本系统生成的表同构)中成绩部分(不是百分制的全部换算成百分制)通过复制-粘贴的方式录入。d) 教务管理员输入及修改完成后,点击“保存”按钮。e) 系统验证数据以确保数据格式正确,判断是否全部参考学生都有成绩(应参加考试实际没有考的学生成绩记0分,没有考试的科目成绩为空,要检查),并出示一个对话框,显示参考的统考名称、时间、年级、学期,参考人数,参考科目,询问是否正确。如果数据有效并询问对话框反馈为确认,就清空数据库中可能以前录入的该次考试该年级各科成绩记录(删除相同“统考名称”的记录),再重

21、新添加成绩(原始成绩记录在原始成绩事实表,有考试名称、学科、学号、原始分,一条记录只记一科成绩,百分等级与标准分汇总时生成。不同年级的学生用不同的原始成绩事实表:如13级的成绩事实表为13FactPerformance表)。 f) 系统向数据库添加完成后,显示“XX级第XX期XX考试各科原始成绩已录入完备,可以开始汇总数据!”的提示,此用例结束,自动开始“汇总”用例。4.备选流a) 无效数据:如果在基本流中系统验证数据格式无效,就会显示错误信息。主角可以修改信息,重新点击“保存”按钮,系统将重复基本流中的56步。b) 取消操作:在点击“保存”按钮前,用户取消,此时用例结束。5.前置条件登录:在

22、本用例开始前,主角要登录到系统,设置好教师、学科、学生班级、教师任课信息,还要设置好本次考试的时间。(9)*汇总成绩(Gather Score)用例1.简要说明教务管理员在确定已录入好成绩后,对成绩进行数据汇总,并把汇总结果存入数据库中。本用例紧接在录入/修改成绩用例之后,所以合并在一起,保存成绩之后就自动汇总。汇总要得到的主要数据可以有:全年级各科的:统考名称(来自考试时间表,选择一个名称也就确定了时间、年级、学期、级别)、该科分制(100分,不是百分制的全部换算成百分制后录入)、该科权值(小于1000整数)、该科同类学校平均分、该科同类学校优生率、该科同类学校及格率、该科同类学校低差率、该

23、科总分、该科平均分、该科标准差、应考人数、90分段人数、80分段人数、70分段人数、60分段人数、50分段人数、40分段人数、30分段人数、20分段人数、10分段人数、该科在同类学校的平均分名次(存入高粒度的成绩汇总事实表);各班各科的:各班各科原始平均分、各班各科班标准差、各班各科应考人数、90分段人数、80分段人数、70分段人数、60分段人数、50分段人数、40分段人数、30分段人数、20分段人数、10分段人数(存入高粒度的成绩汇总事实表)各学生各科的:标准分、百分等级(存入原子粒度的成绩事实表);2.事件流完成录入/修改考试成绩用例后自动开始,启用线程,过程中要提示进度。3.基本流- 汇

24、总成绩a) 教系统向数据库添加完成后,显示“XX级第XX期XX考试各科原始成绩已录入完备,可以开始汇总数据!”的提示,自动开始“汇总”用例。b) 人工录入全年级各科的该科同类学校平均分、该科同类学校优生率、该科同类学校及格率、该科同类学校低差率,存入高粒度的成绩汇总事实表。c) 分学科分别计算出全年级的总分、应考人数、平均分、标准差,统计出90分段人数、80分段人数、70分段人数、60分段人数、50分段人数、40分段人数、30分段人数、20分段人数、10分段人数,再计算出优生率、及格率、低差率,存入高粒度的成绩汇总事实表。S为标准差,(样本)标准差的公式为: d) 再计算出每位考生的百分等级、

25、标准分,并保存到原子粒度的原始成绩事实表。百分等级公式如下所示: (不分组)其中,Pr为百分等级;N为总人数; Fb为小于该分数的向上积累次数。T标准分公式为: 其中,X为原始分,50为标准分的平均分,10为转换为标准分后的标准差;e) 然后依次统计各班各科的原始平均分、各班各科班标准差、各班各科班标准平均分、各班各科应考人数、90分段人数、80分段人数、70分段人数、60分段人数、50分段人数、40分段人数、30分段人数、20分段人数、10分段人数,个位段人数,再计算出优生率、及格率、低差率,存入高粒度的成绩汇总事实表。f) 系统提示汇总完成。4.备选流无效数据:如果在基本流中系统出现各类错

26、误,会显示错误信息。用户可找出原因,修改相关数据,重新汇总。5.前置条件完成录入/修改考试成绩(Input Test Scores)用例。(10)查询成绩(Query Grade)用例1.简要说明教育领导们可以查询历次考试的成绩及汇总报表。主要查看的汇总数据有: 某次考试的同类学校平均分、各科的班平均分、教师平均分、学科在同类学校的平均分名次等。 全年各次考试的班平均分、教师平均分、的变化情况及教师教学考核分等。 查询班级学生成绩分布图、偏科或异常成绩提示、班级成绩变化图等。2.事件流针对不同的选择操作,产生不同的查询事件,主要有教师教学考核分查询(独立的模块)、班级汇总查询(各班各科汇总)、

27、成绩分布对比查询(全校的、同学科各班级/教师对比、同班各学科对比)、历次成绩变化查询(全校的、同班各学科、同学科各班级/教师历次考试成绩变化对比,用T标准分的平均分)、班级学生成绩深析(同班各学科变化对比、班内学生成绩变化对比,用T标准分)3.基本流- 教学考核分查询a) 选择教学考核分查询,显示“教师教学考核分汇总表”模板如图;b) 在第一排依次填入或选择:年级、上期考试、下期考试(系统将查询考试时间表到单选列表框),系统先检查,然后查询上期与本期考试的科目,记下都考了哪些学科(暂记在数组中),并查出这些学科的同类学校平均分、同类学校优生率、同类学校及格率、同类学校低差率(查询高粒度的成绩汇

28、总事实表,保存到二维数组),并检查有无空数据;c) 对各学科依次查询。(先查班级任课表),查出该学科每位任课教师(暂存为数组)及其所教班级(也暂存到二维数组);d) 然后依次查这些教师各期的总的平均分、平均分比率、优生率、优生比率、及格率、及格比率、低差率、低差比率,以及教学考核分,显示到Excel表中;当前学校的成绩评定制度如下:附1: 教学成绩当学年连续两期平均成绩达到或超过同类学校平均分;当学年第一学期未达到但学年末达到或超过同类学校平均分。当学年两期平均成绩均低于同类学校平均分,但与同类学校平均分差距下期比上期缩小;当学年第一学期达到或超过同类学校平均分,但学年末未达到同类学校平均分,

29、且差距在3分及其以下。当学年两期平均成绩均低于同类学校平均分,且与同类学校平均分差距下期比上期扩大;当学年第一学期达到或超过同类学校平均分,但学年末未达到同类学校平均分,且差距在3分以上。附2:教师教学考核分计算办法1、七、八年级教师教学考核分=学年上期(平均分比率优生比率及格比率低差比率)40学年下期(平均分比率优生比率及格比率低差比率)60。2、九年级教师教学考核分=学年上期(平均分比率优生比率及格比率低差比率)50学年下期(平均分比率优生比率及格比率)50。其中各比率计算办法:1、任同年级、同一学科教师(1)平均分比率:教师所教学科总平均分同类学校该科总平均分。(2)优生比率:教师所教学

30、科优生率同类学校该科优生率。(3)及格比率:教师所教学科及格率同类学校该科及格率。(4)低差比率:教师所教学科低差率同类学校该科低差率。2、对跨年级或跨学科教师则按上方式分别核算。相关数据说明1、优生人数:指按百分制核算学生个人成绩(用字母表示),80分的学生人数。2、及格人数:指按百分制核算学生个人成绩(用字母表示),6080分的学生人数。3、差生人数:指按百分制核算学生个人成绩(用字母表示),40分的学生人数。附3:1、学科提高奖某学科平均成绩与上学年最近一次同类学校平均成绩比较,如平均分名次提高则该学科所有教师可获奖,如保持名次不变或名次下降,则不给奖。(八年级物理、九年级化学均以上一学

31、年相应时间的数学成绩为参考。)2、学科目标奖某学科某学期平均成绩达到或超过该学期全区同类(或片区同类)学校平均成绩,即该学科所有教师可获奖。3、个人保位奖有2人及以上在同年级同学科教学的前提下,教师个人教学成绩连续2学期在学校保持年级第一不变,可获保位奖。(七年级第一学期以学年初语文、数学入学考试成绩排位为参考,八年级物理、九年级化学均以上学年最近一次同类型(全区或片区)考试的数学成绩为参考)4.基本流-班级汇总查询a) 选择班级汇总查询,显示“班级汇总查询表”模板如图;b) 在第一排依次填入或选择:年级、学期、考试(系统将查询考试时间表到单选列表框);c) 查出这些学科的同类学校平均分、同类

32、学校优生率、同类学校及格率、同类学校低差率,还有这些学科的全校及各班的平均分、优生率、及格率、低差率(查询高粒度的成绩汇总事实表,先暂存到二维数组),显示到Excel表格中,用例结束;5.基本流-成绩分布对比查询全校的、同学科各班级/教师对比、同班各学科对比。步骤略。6.基本流-历次成绩变化查询全校的、同班各学科、同学科各班级/教师历次考试成绩变化对比,用T标准分的平均分。步骤略。7.基本流-班级学生成绩深析同班各学科变化对比、班内学生成绩变化对比,用T标准分。步骤略。 第三章 成绩管理系统的数据仓库设计3.1 数据仓库设计的特殊性数据仓库具有面向主题的、集成的、不可更新的、随时间的变化而不断

33、变化的特点。本项目中的成绩管理系统从应用上分析,应属于数据仓库系统。如果只为了记录学生的某次考试成绩以用于统计平均分和发布成绩单,Excel的功能已足够,然而本系统希望对整个学校的学生的历次各类成绩进行决策分析,在智能教学网络平台建成后,还要包括学生学习过程中的各种检测数据,这绝大部分都是不可更新的历史记录,很符合数据仓库的特点。数据仓库的特点决定了数据仓库系统的设计不能采用开发传统的OLTP数据库一样的设计方法。数据仓库系统的原始需求不明确,且不断变化和增加,开发者最初不能确切了解到用户的明确而详细的需求,用户所能提供的无非是需求的大的方向以及部分需求,更不能较准确地预见到以后的需求。因此,

34、采用原型法来进行数据仓库的开发是比较合适的,因为原型法的思想是从构建系统的简单的基本框架着手,不断丰富与完善整个系统。因此,本系统的数据仓库采用了原型法进行开发。针对当前学校普遍只保存有统考成绩,作为初次开发的原型,本系统暂只处理统考成绩,下面作详细介绍。3.2 概念模型设计1、确定数据仓库主题我们的数据仓库主题就是学生考试成绩进行多维浅层次分析,属于成绩管理数据集市。多维分析的方向是:l (学科方向)某次考试不同学科,学生不同学科的成绩情况;l (班级/学生方向)同学科不同班级/学生、教师的成绩情况;l (时间方向)同教师、同科、同班、同学生历次考试成绩情况;2、概念模型成绩主题与学生主题(

35、学籍管理系统)、课程主题(课程管理系统)、教师主题(教师管理系统)有联系,如下图所示:图3-1 成绩ER图3.3 逻辑模型设计1、雪花模型图3-2 成绩管理雪花模型可以发现整个成绩管理可以从(班级学生)、(课程教师)、(考试时间)三个方向进行,并希望对相关的维度进行深入的分析,所以需要建立雪花模式,如图6-8所示。这样,就成了一个数据立方体,如图3-3所示。图3-3 成绩立方体2、事实表设计事实表是数据仓库中最大的表,设计时,我们考虑到事实表倾向于更多的行和更少的列,维表则相反。除了各维表的键列之外,事实数据我们采用单科的原始成绩、T标准分、百分等级,都是数值类型。采用单科的目的是为了系统能适

36、应各类检测与考试。接下来的步骤是定义事实表的粒度。定义了事实表的粒度,则事实表能表达数据的详细程度就确定了。事实表从粒度的角色来划分可以分为三类,分别是交易粒度事实表(Transaction Grain)、周期快照粒度事实表(Periodic Snapshot)和累计快照粒度事实表(Accumulating Snapshot)。在事实表的设计时,一定要注意一个事实表只能有一个粒度,不能将不同粒度的事实建立在同一张事实表中。交易粒度事实表的来源伴随交易事件成生的数据,例如我们系统的成绩事实表(FactPerformance),所以也叫原子事实表。周期快照事实表是用来记录有规律的,固定时间间隔的业

37、务累计数据。累积快照事实表用来记录具有时间跨度的业务处理过程的整个过程的信息。这两种是高粒度的聚集事实表,这些高粒度的聚集事实表总是具有较少的维度。通常在建立这些聚集事实表的时候,我们会去掉一些维度或者缩减某些维度的范围。也正因为如此,聚集事实表应该和其对应的原子事实表一起使用。当需要更详细信息时,可以访问其对应的原子事实表。本数据仓库的事实表设计如下:表3-1 原子粒度的成绩事实表(XXPerformance)字段名称标题数据类型说明PID成绩编号自动-长整主键。不同年级的学生用不同的原始成绩事实表。:如13级的成绩事实表为13FactPerformance表EID统考编号数字-长整DimE

38、xam表主键。选择一个名称也就确定了时间、年级、学期CourseName学科文本-8为学科名称表:CourseNameTable主键SID学号数字-长整学号。DimStudent表主键ClassID班号数字-字节为数字形式,如“3”为第3班PrimeScore原始分数字-单精原始分(100分制)StandardScore标准分数字-单精T标准分PercentileRank百分等级数字-单精百分等级表3-2 高粒度的汇总成绩事实表(GatherPerformance)字段名称标题数据类型说明CPIDID自动-长整主键。同一考试不同学科汇总数据IDEID统考编号数字-长整DimExam表主键。选择

39、一个名称也就确定了时间、年级、学期CourseName学科文本-8为学科名称表:CourseNameTable主键ClassID班号数字-字节为数字形式,如“3”为第3班,“0”为全校数据,“100”为同类学校数据Num参考人数数字-长整参考人数, -1为无效数据Deviation 标准差数字-单精标准差, -1为无效数据Average平均分数字-单精平均分ExcellentRate优生率数字-单精优生率PassingRate及格率数字-单精及格率WeakRate低差率数字-单精低差率Frequency9090分段数字-长整90分段人数, -1为无效数据Frequency8080分段数字-长整

40、80分段人数, -1为无效数据Frequency7070分段数字-长整70分段人数, -1为无效数据Frequency6060分段数字-长整60分段人数, -1为无效数据Frequency5050分段数字-长整50分段人数, -1为无效数据Frequency4040分段数字-长整40分段人数, -1为无效数据Frequency3030分段数字-长整30分段人数, -1为无效数据Frequency2020分段数字-长整20分段人数, -1为无效数据Frequency1010分段数字-长整10分段人数, -1为无效数据Frequency0个位段数字-长整个位分段人数, -1为无效数据Comment

41、说明 文本-50说明 从以上事实表中可以看出,为了提高性能,我们适当地引入了冗余,进行了反规范化处理,把一些计算量、聚合值也存储了起来。3、维度表设计维表设计的一大问题是如何处理渐变维度(SCDs, Slowly changing dimensions)。一般渐变维度的处理方法有三种:1改写属性,快速而简单,缺点是丢失历史。2添加新的维度行;可以加生效或截止日期。虽然可以准确跟踪历史但是加速维度表的膨胀,也不能将新旧历史联系起来。3添加维度列,可以有效跟踪新旧历史。我们确定主要使用第三种方法,如增加了学生转入编号、转入时间、转出编号、转出时间等维度列。同时针对本系统针对分数只能对各维度进行浅层

42、次的比较分析,暂不进行数据挖掘,所以各维度表设计很精简,有些维度只有名称,直接设计入事实表中,以减少表间的链接,提高性能。如“班级”,没有专门的维度表,只在事实表中添加了“班级”维度列。还有“教师”也是这样,只在“班级任课”表中直接添加“教师姓名”列。主要维度表设计如下:表3-3 统考表(Exam)字段名称标题数据类型说明EID统考编号自动-长整主键ExamName统考名文本-30(10个字内)同年级不同学科为同一统考名。ExamDate开考日期短日期开考日期 ,如:2012-5-8)Grade年级数字-字节为数字形式,如“13”为2013级学生(2013年毕业)Term学期数字-字节为数字形

43、式,如“1”为第一学期,也就是七年级上期Level级别数字-字节1为校级,2为片区级,3为区级,4为市级,5为省级EState进度文本-10考试项目建立进度标志。分为:新建,导入,检查,汇总,完成.Comment说明 文本-50说明 表3-4 学生维度表(Student)字段名称标题数据类型说明SID学号数字-长整学号。要统一,每位学生三年只这一个学号。Grade年级数字-字节年级(如13级,指2013级学生,2013年毕业的这一级)ClassID班号数字-字节班级编号(用数字,1为1班)StudentName姓名文本-10学生姓名Gender性别文本-2性别(“男”,“女”)IsMark计分

44、数字-字节是否计成绩。1为要计成绩 State状态文本-20状态.正常、毕业、中途转入、休学后复学、借读后回校、中途流失、中途转出、休学、在外借读、智力残疾、病假TransferInID转入编号文本-20转入编号(默认为非转学生,为“0”。转学生,从外转入,为“1”;内部转班,用原来的学号【StudentID】作为转入号)TransferInTime转入时间短时期转入时间(默认为Null,原班生)。TransferOutID转出编号文本-20转出编号(默认为在校生,为“0”。已转学到外地,为“1”;内部转班,用新的学号【StudentID】作为转出号)TransferOutTime转出时间短时

45、期转出时间(默认为Null,为在校生)。表3-5 班级任课表(ClassCourse)字段名称标题数据类型说明CCID自动-长整主键Grade年级数字-字节为数字形式,如“13”为2013级学生(2013年毕业)Term学期数字-字节为数字形式,如“1”为第一学期,也就是七年级上期ClassID班号数字-字节为数字形式,如“3”为第3班CourseName学科名文本-8CourseNameTable表主键TheacherName教师姓名文本-10DimTeacher表主键,保证教师姓名的唯一性,并且不能变更表3-6 教师表(Teacher)字段名称标题数据类型说明TeacherName教师姓名文本-10为主键,保证教师姓名的唯一性,并且不能变更Major教研组文本-10同组的教师Major要一样IsOnService在职数字-字节是否在职。0为不在职,1为在职除此之外,还有三个表,用来记录用户密码、学科名与学生状态:表3-7 密码表(Authority)字段名称标题数据类型说明PWDID权限ID

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1