Apriori 算法在学生信息管理系统中应用研究

作者:申晓改时间:2015-02-09 09:27:11  来源:www.ksfbw.com  阅读次数:1514次 ]

Apriori 算法在学生信息管理系统中应用研究

 

申晓改  石家庄职业技术学院  河北石家庄  050081

 

【文章摘要】

 

   随着学生信息量的增大和信息化时代的到来,校园管理工作中的传统数据库显然已经无法满足越来越庞大的学生信息管理需求,而要想提高学生信息管理的工作效率,促进校园管理工作的发展,就必须利用相关数据挖掘技术对学生信息进行有效数据的提取,加强学生信息管理系统的相关工作效率。本文将以学生信息管理系统作为主要切入点,分析和研究Apriori算法在学生信息管理系统中的应用。

 

【关键词】

 

Apriori 算法 信息管理 数据挖掘

 

前言

 

对于学校而言,管理好学生信息工作无疑是校园管理工作的重点,学生信息内容主要包括学生资料、成绩和评估等方面,这些数据向来庞大,若相关管理者不能对这些数据进行处理,则容易造成教师教学工作的不便。学生信息数据通常格式混乱,信息存储和查阅时需要花费大量的时间和精力,而Apriori算法的出现和应用则让管理人员能够更好的对学生信息数据进行管理,为了让管理人员能够更好的对学生信息数据进行管理,Apriori算法能够对学生信息数据进行有效挖掘,并利用关联规则从庞大的数据库中找出有效知识,从而便于管理人员对学生信息进行搜索和查阅,促进学生信息管理系统的发展。

 

关联规则及经典关联规则算法 

 

1.1 关联规则

 

关联规则是为了从大量的数据库中挖掘数据中项集之间的联系,关联规则的挖掘主要体现在以下两个方面,一是资料结合中所包含的所偶高频项目组,而是这些高频项目组中所产生的关联规则。要想运用关联规则进行资料或数据的挖掘,在挖掘之前要做好门槛值的限制,即设定最小支持度与最小信赖度。并且从Apriori的算法形式上我们可以看出,关联规则作为一个逻辑公式,不仅能够满足最小支持度阀值的要求,还能够达到最小信赖度阀值的数量,当数据前后都是项集,利用关联规则对这些项集进行挖掘则能够有效找出数据中所隐藏的知识。关联规则的定义是 指 ,当 { } iii m I .,21= 作为m个不同项的集合时,假设交易数据库(交易集合)为D,在集合D中所存在的元素都是X=Y,且IX ⊂ , IY ⊂ ,  φ = YX I 。X表示规则Apriori 算法在学生信息管理系统中应用研究 申晓改  石家庄职业技术学院  河北石家庄  050081前件,Y指规则后。在这一数据的挖掘过程中,关联规则的作用就是将所有满足用户自定义的关联规则进行全面挖掘,并且其挖掘的支持度和信赖度都要大于设定的最小支持度与最小信赖度。

 

1.2 Apriori 算法

 

Apriori算法指的是一种基于项集的基础上,进行关联规则挖掘的频繁项集算法,在项集中采用Apriori算法并进行多次的数据扫描可以得出关联规则的挖掘,当第一步的扫描结果是频繁1-项集的集合,即频集为L1 ,第 K ( ) 1 ≥ 步所扫描的结果则为(K-1)次的扫描结果,找到的频集为LK 1 = ,在此基础上,当候选数据K-项集的集合CK 出现后,在扫描过程中就要确定频集CK 中元素的支持度,不管扫描多少次,每一次频集扫描结束后都要进行K-项集的集合LK 的计算,只有在候选K-项集的集合CK 数据为零时,才终止 Apriori 算法。本算法就是通过频集 Lk 1 − 找到 LK ,在算法过程中,主要分为连接和剪枝两部分,连接部分是利用递推公式将频集Lk 1 − 计算出来进行 LK 的寻找,这时可利用Lk 1 − 的连接产生数据候选集合并标记为CK ,将 I1 I2 设为 Lk 1 − 中的项集,当 [ ] jI i 作为 I i 的第j项时,关联规则进行Lk 1 − 和 Lk 1 − 连 接 ,且Lk 1 − 内的元素满足数据连接性;当进行到第(K-2)项发生数据变化,(K-2)项与之前项完全不同时,(K-2)可标记为 [ ] [ ] 1 1 2 1−∠− K K II ,即公式[ ] [ ] [ ] [ ] [ ] [ ] [ ] [ ] 1 1 2 2 2211 2 1 2 1 2 1 2 1−∠−∧−=−∧∧== K K K K IIIIIIII KK,此 时 Lk 1 − 内的所有数据元素包括 I1 和 I2 都具有连接性,即项集[ ] [ ] [ ] [ ] 11 21 2 1 21−− KK IIII LL 为最终数据。

 

2 Apriori 算法在学生信息管理系统中的应用

 

笔者拟定我院2010级电子与信息技术专业毕业班的学生成绩信息为数据挖掘中的原始数据,并采用Apriori算法对这些原始数据进行分析,探究和说明Apriori算法对于学生信息管理系统的促进作用。

 

2.1 数据采集

 

如表1所示,该表为2010级电子与信息技术专业毕业班学生原始成绩数据,将所有学生学习成绩数据进行统计并建立原始数据库,该数据库中包含50名学生,22 名课程,共有记录 1058 条。

 

2.2 数据预处理

 

为了便于后期数据处理,简化数据存储过程,我们可以将数据中课程的编号用符号代替,如表2所示,学生姓名统一用学号代替,学生所学课程如体育、语文、英语等使用符号 C1C2C3C4 代替,将原始数据进行预处理转换后即可得到如表 所示数据 ::表 数据预处理后的数据表

 

2.3 数据转换

 

为了使数据在挖掘过程中能够更全面的展现,首先要对数据格式进行转换处理。在进行学生成绩数据的挖掘过程中进行关联规则的引入,同时为了方便后期数据挖掘,使各学科之间的成绩优劣体现明显,成绩在 90 分以上的用数字 表示,90分以下的成绩统一用数字0表示,数字1代表该项存在于事务中,而数字0则正好相反,表示该项不存在与事务中。

 

2.4 应用 Apriori 算法进行数据挖掘

 

如表3所示,我们将支持度设定为0.2,置信度设定为0.6,并在关联规则表中进行转换数据导入,再采用Apriori算法同步进行学生成绩与科目的挖掘,从而得出学生成绩与科目之间的关联规则,表3为学生部分成绩与科目的关联规则。表 关联规则表从表3数据可知,学生从上表得知高等数学的达标率与大学英语的达标率置信度约为63%,而大学语文与信息技术达标率的置信度则约为 60%

 

总结

 

总之,Apriori算法中对于数据的挖掘性与精准性在学生信息管理系统中起到了巨大的推动作用,不仅提高了校园重点课程建设水平,还减少了管理人员的工作压力,提高管理质量,Apriori算法在信息管理系统中所体现出的优越性和实用价值必定会得到推广,成为各大高校今后在学生信息管理系统领域中的主要发展方向。

 

【参考文献】

 

[1] 王永娟 .Apriori 算法在高校学业管理中的应用[J].铜陵学院学报 ,2011,10(2):98-99.

 

[2]王培吉,赵玉琳,吕剑峰.基于Apriori算法的关联规则数据挖掘研究 [J]. 统计与决策 ,2011(23).表 学生原始成绩数据

 

本站论文资源均为来自网络转载,免费提供给广大作者参考,不进行任何赢利,如有版权问题,请联系管理员删除! 快速论文发表网(www.ksfbw.com)本中心和国内数百家期刊杂志社有良好的合作关系,可以帮客户代发论文投稿.

投稿邮箱:ksfbw@126.com
客服Q  Q: 论文发表在线咨询82702382
联系电话:15295038833

本站论文资源均为来自网络转载,免费提供给广大作者参考,不进行任何赢利,如有版权问题,请联系管理员删除!

广告推荐

文章评论

共有 0 位网友发表了评论

阅读排行

推荐文章

最新文章