改进型Apriori算法在学生管理系统中的应用研究.doc

上传人:3d66 文档编号:1830305 上传时间:2019-01-10 格式:DOC 页数:6 大小:14.63KB
返回 下载 相关 举报
改进型Apriori算法在学生管理系统中的应用研究.doc_第1页
第1页 / 共6页
改进型Apriori算法在学生管理系统中的应用研究.doc_第2页
第2页 / 共6页
改进型Apriori算法在学生管理系统中的应用研究.doc_第3页
第3页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《改进型Apriori算法在学生管理系统中的应用研究.doc》由会员分享,可在线阅读,更多相关《改进型Apriori算法在学生管理系统中的应用研究.doc(6页珍藏版)》请在三一文库上搜索。

1、改进型Apriori算法在学生管理系统中的应用研究 摘要:如今学生信息管理在高校管理工作中的地位已越来越突出,但由于学生信息管理工作内容繁多、数据庞大、数据来源格式不统一,在一定程度上给学生信息管理工作带来了困难。改进型Apriori算法在关联规则、数据挖掘技术的基础上更加具有针对性、准确性和优越性,这为基于改进型Apriori算法在学生管理系统中的应用提供了可能,有利于提高学生管理的效率和质量。 0 引言 目前,在学校管理工作中对于学生的信息管理越来越重视,但由于学生信息管理工作内容(如学生的资料、成绩、评估等)繁多、数据庞大、数据来源格式不统一,所以在一定程度上给学生信息管理工作带来了存储

2、、查阅、分析等方面的困难。如何提高学生信息管理工作的有效性,积极发挥学生信息管理系统的辅助作用,并充分挖掘学生在校各门课程成绩中的有效规则,成为各大高校需要重点研究的课题。因此,本文提出了基于改进型Apriori算法构建课程成绩分析模型,以提高学生管理系统的功能性,促进高校办学质量的不断提高。 1 关联规则算法 关联规则,即借助数据挖掘技术从海量信息数据库中分析和提取出高频数据项,进而挖掘出项组之间存在的关系规则,以实现对资源的有效利用。在实际应用领域,关联规则的理念得到了广泛应用,对于提高领域的服务质量具有较大帮助,在此基础上相关研究者提出了关联规则算法。基于数据挖掘技术的关联规则算法是一种

3、具有较强影响力的递推算法,在计算过程中以频集递推思想实现两个阶段的计算流程:寻找出数据信息中的全部频集,以频集生成同时满足最小支持度与置信度的强关联规则;排除最小置信度小于用户预定的生成规则,进一步搜索、扫描余下频集,对空间进行压缩、收缩操作,且需满足频繁项集置信度的不断提高。 若要在程序中实现关联规则,具体需要完成如下步骤:设计一个类,使之能够包含各种项集;进行PID对象的频繁项集判断,之后利用事务表存储方式完成SQL查询,以判断频繁项集是否满足标准;构造Lu为频繁项集的非空真子集,然后计算连接步,连接成功便会产生k+1的候选项集,并计算得出该项集的支持度,判断和标记频繁项集的标准为:支持度

4、2项集与其它各项进行自然连接,进而生成n的候选项目集,在数组Pn中以升序方式存储候选项目集;对二维数组进行扫描,以得出候选项“n-”集的支持度,在数组Pn中记录保存;将支持度计数小于最小支持度Pn的行、列删除,直至求解出全部的频繁项集。最后,将最终的频繁项集中的所有非空子集的置信度求解出来,以生成最终规则。 实际上,Apriori算法的改进主要体现在3个方面: (1)剪枝步的算法改进。根据Apriori的性质可以得出一个结论,即若是一个项目集符合频繁要求,则其全部子集也符合频繁要求,反之若为非频繁性,则其全部超集也属于非频繁性。通过连接Apriori算法生成了候选项集,并对候选项集的全部子集进

5、行频繁集判断,然后进行剪枝以降低过程中的负荷,从而有助于候选项集生成速度的提高。 (2)程序改进。转化数据表中的数据,使之成为二维数组中的数据,则不需要在数据库中进行各数据的记录、搜索和判断,候选项集判断是否符合频繁项集要求的效率显著提高,从而进一步促进了程序运行效率的提高。 (3)当频繁集生成之后,将其没有关联的行与列删除,从而拓宽存储空间,以实现数据读取速度、算法运行效率的提高。 3 应用实例分析 高校要想实现对学生的科学、有效管理,必须全面了解学生的信息与表现,对学生有一个合理的综合评价,才能在管理学生过程中有一个正确的决策判断。因此,学科成绩、综合评测成为高校管理学生的重要依据,构建以

6、这两方面信息为主的数据库模型,积极运用改进型Apriori算法进行挖掘和分析,是提高高校学生管理有效性的一个较好方法。本文以2009级机械工程专业毕业班学生为研究对象,基于毕业班学生的成绩建立原始数据库,运用改进型Apriori算法分析和挖掘这些原始数据,以挖掘出一些有利信息,为高校学生管理提供依据。 第一步:数据采集。2009级机械工程专业毕业班学生是本文的主要研究对象,首先需要采集所有毕业班学生的成绩,建立一个原始数据库,具体如表1所示。主要内容有:学号、姓名、课程名、成绩、学分、学时、选课性质。在已建成的原始成绩数据库当中,主要内容包括:48名学生、22门课程,共计1 056条记录。 第

7、二步:数据预处理。存储是数据预处理的重要准备工作,但过多的项目、复杂的课程名称等客观因素都会加大存储过程的难度,因而为了让存储过程更为简化,一方面可以将课程名用简单符号表示,利用数据转换方式有效提高数据预处理效率,另一方面可将一些无关项目删除。具体如表2所示,这是数据预处理后的数据表,学生姓名用学号表示,课程名用“字母+数字”表示,例如体育:C1,大学语文:C2,实习:C3,大学英语:C4,以此类推。 第三步:数据转换。以往数据来源格式不统一是造成系统数据转换困难的一大因素,因此在进行第三步“数据转换”操作之前应统一处理所有数据格式。之后,开始数据转换操作:引用关联分析对学生成绩进行挖掘,同时

8、转换预处理后的数据,使之成为逻辑型数据;以布尔型数据来表示学生的成绩数据表,为更好地表现出各学科之间的差异关系,在此需要进行简化操作。即:用“1”代表成绩在90分以上的数据,并表示事务中该项存在;用“0”代表成绩在90分以下的数据,并表示事务中该项不存在。 第四步:应用Apriori 算法进行数据挖掘。根据表1、表2的数据信息进行置信度和支持度设置,使其分别为0.6、0.2,然后在关联规则表中导入转换后的数据,同时应用Apriori算法计算、挖掘出科目和成绩之间的关联规则。部分关联规则的内容如表3所示。 由表3可知,大学语文、大学英语取得“优”的置信度都为62.25%,工程力学、机械制图取得“

9、优”的置信度都为64.26%。诸如此类,具有相同置信度情况的还包括机械制图和电工基础、工程力学和管理学。根据挖掘显示结果可以得出结论:工程力学、机械制图2个科目是较为重要的课程,因此在课程设置和管理中需要加大对这2个科目的重视程度。 4 结语 本文通过分析关联规则算法获得了改进型的Apriori算法,该算法在数据挖掘技术基础上更加具有针对性、准确性和优越性,能够有效提高应用领域的服务效率和质量,为基于改进型Apriori算法在学生管理系统中的应用提供了可能。本文还通过实例分析了改进型Apriori算法在学生管理系统中的具体运用,通过数据采集、数据预处理、数据转换、数据挖掘优化管理系统功能,对课程建设和提高教学水平发挥了积极作用。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1