开题报告_基于数据挖掘方法的学生课程推荐算法研究由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“数据挖掘算法结课报告”。
基于数据挖掘方法的学生课程推荐算法研究
一、课题来源及研究的目的和意义
1.1 课题来源
计算机技术的进步,以及计算机网络建设的完善促使着社会信息化进程持续发展[1]。信息数据的获取、记录、保存、检索等操作也因为新技术的不断应用而变得更加方便快捷[2]。一方面,遍布各处的计算机网络终端设备打破了信息数据记录的时间和地域限制,让我们可以随时随地发送和接收数据;另一方面,存储速度越来越快的大容量电磁存储技术大大降低了信息数据存储的代价,使得记录并长时间保存海量数据成为现实。总体来说,在当今社会的各个领域中,信息数据的记录已经告别了“记账簿”形式的传统方式,迈入了电磁化存储的新时代[3]。信息数据存储需求与信息数据存储代价两者之间的矛盾进一步深化为信息数据存储数量激增与信息数据处理能力停滞不前的矛盾。简单的说就是“我们应该如何获取蕴涵于海量数据之中的信息?”这一问题。总所周知,信息处理是一个知识创造的过程。这个过程需要具有某领域专业知识的专家通过对数据进行分析来完成。数据的大爆炸使得整个信息处理过程不堪重负。在原始的信息处理方式日益不能满足信息处理的需求的背景下,在统计学、计算机科学、人工智能等多学科知识融合的基础上,数据挖掘方法应运而生,将数据处理和信息获取从原始的人工方式转向了大规模计算机自动化的方式,开辟了信息数据处理的新局面[4]。
教育是立国之本。随着我国改革开放的不断深化,教育事业正在逐步成为我国现代化建设过程中的一项重要工作[5]。我国的各项新教育政策的出台鼓励更多的青少年走进学校接受高等教育,为祖国的未来贡献自己的力量。到2020年,我国的大学入学率计划达到40%,较2006年提高了17%。在如此庞大的学生群体面前,人均可利用的教育资源正在逐年缩减。如何在有限教育资源的前提下,提高教育资源利用率是关系我国教育教学质量的重要问题之一。为此,需要我国的教育工作者深入研究我国目前的教育体制,提出合理化建议,健全我国教育教学体制,提高教学质量。衡量教学质量的关键因素是学生,量化学生学习质量的主要指标是学生成绩。面对3000万学生以及上亿的成绩数据,显然数据挖掘是必不可少的信息数据处理方法[6]。
1.2 课题研究目的和意义
我国的现代化教育体系建设起步虽然略晚于西方发达国家,但是其发展却相当快速,并且取得了长足的进步。其中最具代表性的就是目前广泛应用于各所高校中的学生成绩数据挖掘系统。由于不同高校在重点学科建设的倾向性不同,所以各个高校在系统建设的指导思想上和具体实施过程中都结合自身的特点有所取舍,不同系统之间取长补短,各具特色,形成一种“百家争鸣,百花齐放”的良性竞争局面。其中效果较好的方法是将系统分为数据获取、数据处理、信息挖掘、信息理解和结果应用五个模块[36-40]。在信息挖掘和信息理解模块,系统综合运用Apriori算法、C4.5算法、K-means算法和层次聚类等机器学习方法,构建完善的学生成绩分析平台[41,42,43]。于成的《数据挖掘在学生成绩分析中的应用》、武丽芬和孟强的《学生成绩数据挖掘的研究与实现》、朱燕燕的《学生成绩数据挖掘系统的设计与应用》、白玲的《数据挖掘在高校学生成绩分析中的应用》都是基于这种思想构建的教学平台。虽然这些方法在算法的具体细节上都具有各自的特点,但是它们的关注焦点都集中在对数据中关联规则的挖掘。通过有效地发现、理解、运用关联规则,能够使隐含于大量数据之中复杂而有用的知识为现代化教育系统的建设做出更大的贡献。这些系统所需的数据来源于多年来教学过程中积累的学生考试成绩。通过对这些数据的深度挖掘不难发现,学生成绩的高低不单单取决于课程本身,还会受到学科的课程设置、教学计划的制定、各门课程的先后顺序等诸多方面的影响。由此产生了学者关于“如何为学科设置课程”、“各门课程之间的相互关系”、“如何评定综合学生学科综合成绩”等问题的思考。经过高校教育工作者、领域专家学家多年来共同的研究与实践,我国已经探索出一条符合中国教育实际情况的发展之路。高校智能排课系统的出现正是其中[45,46,47]重要的成果之一。四川师范大学2008年在汪晓飞等学者的努力下,成功将遗传算法应用于求解排课问题中,取得了良好的效果。该方法分析对比确定了一系列影响排课问题的因素,将其作为约束条件建立排课问题最优化模型,通过遗传算法多代进化找到了科学合理的课程排列顺序。2011年大连交通大学的刘震根据实际的工作经验,在原有的研究基础上全面阐述了排课工作的原则、流程以及重点难点。针对排课问题中易出现的冲突,他应用关联规则算法加以解决,排除了排课问题中漏课重课的错误,减轻了人工排课的压力,提高了学生学习的效率。将智能排课与自动出题、考试成绩分析三者相结合,从根本上改变了传统教学方式下经验式排课、院系集中出题、教师人工阅卷的局面,将教师从繁重的教学辅助工作中解放出来,使其能够有更多时间指导学生的日常学习,答疑解惑[48]。
二、国内外在该方向的研究现状及分析
国内外学者已经从不同角度,不同侧重对这一问题进行了深入的研究与探讨。尤其是近年来,随着全世界对教育热点问题关注度的持续升温,许多新思想、新方法层出不穷。其中着重于学生考试成绩分析的研究方法一直是解决这一问题的热点[25,26,27]。印度学者Brijesh Kumar Baradwaj和Saurabh Pal在2011年发表的论文《Mining Educational Data to Analyze Students’ Performance》中提出一种通过分析学生考试成绩数据的方法来预测学生的表现。该方法首先通过在线考试系统获得学生的考试成绩数据,然后建立高校教育系统的数据挖掘模型,利用以ID3决策树为主的机器学习方法对模型中的数据进行分类,最终达到预测学生在学校学习情况的目的。与之相关的数据方法还包括Pandey和Pal提出的《Data Mining: A prediction of performer or underperformer using claification》。这种方法以学生的年级和先修课程为基础,以贝叶斯网络为手段,目的是预测初学者可能出现的学习情况。此类方法都是典型的机器学习方法。它们需要采集学生的多种信息数据作为算法的分析基础,通过多种机器学习方法相结合的方式构造数据挖掘模型,并将构造好的分析模型应用于具体的分类和回归问题中去[28,29]。除了上述的决策树学习算法和贝叶斯网络算法,常用的数据挖掘方法还包括聚类算法、神经网络算法、遗传算法和线性回归算法等[30-35]。利用准确的成绩预测模型,我们还可以继续深化关于问题的研究。例如Galit等在论文《Examining online learning procees based on log files analysis: a case study 》中描述了一种教学辅助系统就是对考试分析结果的再利用。该系统根据学生的学习情况,为学生提供必要的学习计划,督导学生按计划执行学习,帮助学生顺利通过最终的学科测验。
三、主要研究内容及创新点 3.1 主要研究内容
目前,我国的现代化教育体制综合信息平台主要分为以下四个方面[7]:第一,现代化远程教育系统;第二,基于海量题库的自动出题系统;第三,学生成绩的智能分析系统;第四,学科设计及教学计划的优化系统。上述四类系统基本涵盖了现代教育体系中从教育规划到教育实施的各个方面。如果这四部分能够相辅相成,相互融合形成一个有机整体,那么将会打开我国的教育现代化的新局面,使整个基础教育事业迈上一个新台阶[8]。但是在实施过程中,由于这四部分的难易程度有所区别,导致了它们的发展水平参差不齐。其中随着我国计算机硬件及其他辅助设备的不断普及和基础网络设施建设的不断完善,远程授课系统不断推陈出新,从最初的单向讲授形式发展到先进的双向交互形式,大大提升了学生的学[9]习兴趣和学习效果。而计算机自动出题系统的广泛应用已经彻底改变了原有考试形式的单一性,大大增强了考试的灵活性,同时也防止了考试试题泄露等不端行为[10-13]。在此基础上建立起来的考试评分系统,不仅大大缩短了考试成绩的评判周期,避免误判漏判现象的发生,从根本上维护了考试的公平公正原则。相比较上述几部分,我国的教育体系信息平台对于学生考试成绩的分析和利用,还停留在评价学生知识掌握的程度的单一层面上。事实上,考试制度的建立不单单是为了衡量学生对知识的记忆能力,而是为了通过考试这种形式来帮助学生找出学习过程中的不足,采取适当的方式加以指导,最终达到知识理解和再应用的目的[14,15,16]。更进一步的是,在国内外文化充分交流的今天,我国高校借鉴西方知名学府的先进经验,普遍采取了学分制的教学管理模式。这种新兴的教学模式能够激发学生自主学习的兴趣,有助于跨学科综合性人才的培养。在带给学生很高的学习自由度的同时,也使原先适应了传统教学习惯的学生面临新的挑战[17]。如何制定适合自己的学习计划是摆在每个学生面前的重要问题。毕竟面对种类繁多的学科,缺少学科深入认知的学生们只能凭着自己对学科内容的表面理解进行选择。这种摸着石头过河的学科选择方式显然是不可取的。因为这种做法既忽视了学生自身的特点,又没能提供必要的教学指导,很可能导致学生学习进度缓慢,甚至半途而废现象的出现[18,19]。
学校教育的最终目的之一是为学生就业做准备。对于在校学生,他们对今后工作所需技能的了解相对较少。因此,在选择课程时往往缺乏针对性,不能对今后的就业起到良好 的支撑。为了避免学生课程选择的盲目性,学校需要结合在校学生的具体情况和具有相似情况的毕业生的学习过程为其推荐适当的学习计划,并视学生在实际学习过程中的情况做出动态调整。这种量体裁衣式的课程教学方法使得每一个学生在学习过程中都能得到及时的指导,有助于学生学习兴趣的持续发展,有助于学生最终完成本学科的学习,掌握相关领域知识,在今后的就业过程中能够脱颖而出起到了良好的辅助作用[20,21,22]。
为了建立一个行之有效的学生学习指导体系,我们需要总结、分析一下四方面的问题:
1.学生的学习需求。学习的需求来源于学生的兴趣。在当今社会中,信息的获取易如反掌。学生根据自身的喜好,不断的在探索着信息海洋,并逐步积累起对某个学科最基本的认识。这是学生学科选择的原动力。同时,学生的学习需求还会受到社会就业需求的影响。随着学生对所学学科的深入了解,他们的学习倾向一般会朝着社会需求的方向发展。我们需要以此为出发点,指导学生进行合理的学习。2.学生的知识储备。学生在对某学科进行深入学习前,一般对该学科已经有了初步的认识。这是学科学习的重要前提。为了更好的进行深层次的学习,我们首先要求学生具有相关的学习基础。勿在浮沙筑高台。合理安排学习内容的先后顺序,对整个学科的学习质量有至关重要的影响。3.学生的成绩评价。大多数情况下,初学者不能对自己的学习状况做出正确的判断。正是由于这个原因,需要我们对学生的知识掌握程度做出正确的、客观的估计。其中最直接的方法就是量化学习成绩。也就是通过考试给学生的学习状况打分,以分数的高低作为其知识掌握程度的标准[23]。虽然考试成绩对学生学习状况的量化评价起到了重要的作用,但是需要注意的是学生的在校学习成绩是学生综合素质体现的一个方面,评价以就业为最终目标的学校教育必须以“学生是否就业”为根本标准。4.学生的继续学习。学校通过考试的形式来度量学生的学习效果,所以考试是已学知识的结束。学习是一个发展的过程,一种知识的获取往往会扩大学生的知识面,激发其新的学习兴趣,这就形成了新的学习需求。学习的目的,特别是基础知识的学习是为更深层次的专业知识学习做积累,所以考试也是未学知识的起点。通过已学知识的评价,估计未学知识的学习计划,是对学生成绩分析结果更充分的利用。
上述四个问题循环往复,既相互制约,又相互促进。如果能够正确处理其中的关系,使之形成一个可持续良性循环,那么将会大大增强学生的学习效果[24]。
3.2 创新点
1.通过关联规则挖掘方法和聚类算法确定课程与课程之间的教学顺序关系;
2.通过决策树生成算法完成学生就业满意度与课程选择之间关系的确定; 3.综合上述两方面,采用多种机器学习算法协同工作的方法完成课程推荐算法。
四、研究方案及进度安排,预期达到的目标
4.1 研究方案
当前各所高校都在如火如荼地创新教学理念,下大力度转变教师为院系服务为教师为学生服务,推广以学生个人发展促进学校发展的新思路。然而逐年的高校扩招,激增的学生数量使得教育资源特别是教师资源捉襟见肘。面对求知若渴的学生,更需要经验丰富的教师来指导他们的学习之路,充分激发他们的学习欲望,造就一批批具有牢固专业知识的人才,使其能够胜任今后的工作。“如何指导学生进行课程选择与进度安排”正是摆在每一名教育工作者面前的重要问题。本文立足上述优秀理论及实践的基础上,继承和发扬前人研究成果,意在将数据挖掘方法引入解决问题方案,使之能够根据学生的就业满意度等因素科学指导学生安排课程[49,50]。
数据挖掘工作以数据为基础,以算法为核心目标。为了完成学生指导工作,我们需要以下工作的定义:
1.数据挖掘的目标。本文目的是在综合分析已毕业学生的就业满意度与学生在2.3.4.5.6.校期间学科选择、考试成绩的关系,为在校学生制定符合其就业需求的学习计划。经过科学合理的总体计划和扎实的分步实施,最终使学生能够顺利达到学科学习的整体要求,在毕业后的就业过程中能够脱颖而出。
数据挖掘的模型。为了达到预期目的,我们需要建立一个预测模型。该模型以学生以往学生的就业满意度和实际学习情况作为参考,预测在校学生可能感兴趣的学习点,为其提供适当的学习课程。这个预测过程伴随学生整个在校学习期间,形成一个学生学习的发展路线图。在模型实现过程中,本文将预测模型细化为若干过程,可分为课程相关性分析、学生成绩分析、学生就业满意度分析三个主要过程。
数据挖掘所需数据的收集和整理。我们为数据挖掘模型所提供数据的质量直接影响其预测能力。一方面,准确记录的数据可以为模型提供正确的指导,而噪音数据的存在则可能误导预测模型。另一方面,并不是越多的数据就意味着越高的预测准确率。在信息过载的今天,获取数据绝非难事。但是无意义的或冗余的数据既提高了数据采集的代价,也延长了模型的构造时间。为了给数据挖掘模型提供充足的有用的数据,还需要在数据收集过程之后进一步对原始数据进行处理,去其糟粕取其精华。
数据挖掘算法的训练方法。选择什么样的方法对数据挖掘模型进行训练是论文整个工作的核心内容。本文的工作是由多个部分共同组成的,在各个不同的部分需要不同的训练算法。这些算法可以分为两类分类算法和聚类算法,其中分类算法主要用于学生成绩分析、学生就业满意度分析,聚类算法主要用于课程相关性分析。
数据挖掘算法的测试。经过对数据挖掘模型的训练,最终我们将得到一个用于学生课程选择的辅助系统。系统不断采集学生最新的就业满意度、学习课程、学习成绩信息加入数据库,然后根据学生信息库动态更新学生的学习计划。
数据挖掘的结果分析。该数据挖掘模型的优劣,最终需要由学生自己做出主观判断,并辅以全院系学生的整体就业满意度作为客观判断。最终综合二者得出的结果是判断“模型是否符合学生学习的要求”的主要依据。
4.2 研究进度安排
2012-04-05~2012-05-04
完成开题报告,提交指导教师。
2012-05-05~2012-08-04
收集相关资料,构思并确定写作大纲,请指导老师加
以修改。
2012-08-05~2012-10-04
撰写论文初稿。2012-10-05
完成论文初稿。
2012-10-06~2012-11-05
请指导老师对初稿提出修改意见,完成二稿。2012-11-06~2012-11-19
请指导老师对二稿进行指导并按老师的建议进行修
改,完成最终稿。
2012-11-20
提交论文最终稿。2012-11-20~2012-12-10
请评阅老师审阅,准备论文答辩幻灯片(PPT)。
4.3 预期达到的目标
1.得到课程与课程之间的序关系。根据课程度学科综合考试的贡献度确定哪些课程属于学科基础课程,哪些课程属于专业基础课程,哪些课程属于专业选修课程。指导学生在学习过程中学习的先后顺序。
2.理解学生就业满意度与课程选择之间的关系。在课程选择前先根据已毕业学生的就业状况为学生的课程选择提出合理化建议。总体教学遵循针对性学习的思想,使学生能够学以致用。
3.建立一个可应用于实践的学生自动课程推荐体系。切实解决学生被指导需求量大,教师资源不足的实际情况。使学生在学分制体系下,可以充分发挥自己的主观能动性,学有所长。
五、为完成课题已具备和所需的条件
5.1 已具备的条件
为了完成本课题的研究,我们需要从三个方面入手。或者说,这三个方面是研究得以开展的必备条件。其中首要条件是研究的理论支持。研究不是空想,需要以成熟的理论作为研究指导,否则就是空中楼阁。本文以目前广泛应用于各个领域的数据挖掘理论作为总的指导思想,并结合本课题的实际情况,辅以前人的优秀科研成果,三者结合为论文研究工作的顺利进行提供了坚实的基础。
其次,研究的价值体现在其实用价值上,不具有可行性的研究是毫无意义的。本文的研究过程是伴随着实验过程进行的。两者相辅相成,理论研究指导实验开展,实验过程完善理论体系。前一阶段的资料搜集和论文学习工作,目前本人已经具备了完成研究的理论知识和相关实验技能,这些都将成为完成论文研究的有力支撑。
最后,在数据挖掘过程中,数据是整个过程中最重要的资源。我国教学体制改革多年来积累的学生数据正是我们完成本课题研究的重要保障。
5.2 所需的条件
一年多的时间过去了,目前关于数据挖掘理论知识的学习,基本实验方法的实践和论文的搜集工作都已经告一段落,可以说论文的前期准备工作基本已经结束了。接下来的工作主要从两方面入手。第一,论文的写作。本论文的写作遵循提纲式写作方法,因此需要我们在论文搜集工作的基础上,进一步对这些论文进行整理,从而确定本论文的大体思路,列出论文提纲,为论文初稿写作做准备。第二,实验的开展。实验是本论文的重要组成部分,实验结果的好坏直接影响到研究的进展程度。因此,需要我们掌握扎实的实验操作知识,以保证实验工作的正确性。这些实验知识涉及到机器学习算法的伪代码编写、计算机软件设计与实现、程序的调试与排错、以及软件测试与算法分析。
六、预计研究过程中可能遇到的困难和问题以及解决的措施
在本课题的研究过程中,可能遇到存在的困难主要来源于实验数据的准备、算法的设计以及、实验结果的分析。下列给出了主要的困难及相应的解决办法:
1.实验数据的准备。本文的实验数据全部来源于高校的教学系统。但由于我国教育体制的不断改革,也使得系统所采用的数据记录方式存在一定的差异。为了得到形式统一的数据,还需要我们对一些未记录数据进行补充。在一定程度上,我们对数据的判断能力,决定了实验结果的可靠性。为此,我们首先要有严谨认的科学态度,通过数据挖掘中数据预处理和手工处理相结合的方式,最大程度上保证数据的正确性。2.算法的设计。算法是软件的灵魂。本文的算法设计包括算法的理论正确性和逻辑正确性。其中理论正确性是以本文的研究工作作为基础的,而逻辑正确性是以计算机软件设计方法作为基础的。
3.实验结果分析。实验结果直观反映了研究工作的正确性。通过对实验结果的分析,可以及时发现算法中存在的问题并做出调整。这其中一些的错误看似随机,影响了我们对算法的正确认识,需要我们反复进行实验,观察结果,认真分析,将算法中的错误减少到最低。
综上所述,在研究过程中需要我们广泛查阅文献、反复动手实验、积极深入思考,当然也少不了老师的悉心指导和同学们的热心帮助,才能更好地完成本课题的研究和本文的写作。
七、主要参考文献
[1] 张庆锋, 郑建明, 王育红.社会信息化进程测度指标体系之构建.情报科学, 2000, 09: 772-775.[2] 谢俊贵.我国社会信息化的涵义、作用及推进策略.情报理论与实践, 2002, 04: 244-248.[3] 王旭东.论社会信息化的影响与冲击——从当代历史进程到世界史研究.世界历史, 2007, 05: 43-52.[4] 罗晶.基于数据网格技术的远程教育系统的研究.南昌大学工学硕士论文, 2006.[5] 黄越岭.可视化远程教育管理系统研究.西南大学工学硕士论文, 2007.[6] 南翔宇.农村远程教育平台建设和服务体系研究.西北农林科技大学工学硕士论文,2008.[7] 李佳.基于IRT模型的题库智能组卷策略.江西师范大学工学硕士论文, 2007.[8] 李军.基于遗传算法的智能组卷系统研究.天津大学工学硕士论文, 2008.[9] 刘贝贝.基于推理与遗传算法的智能组卷模型与系统实现.烟台大学工学硕士论文,2009.[10] 贺敏之.基于遗传蚁群算法的智能组卷系统设计与实现.湖南大学工学硕士论文, 2010.[11] 赵志艳.基于遗传与蚁群混合算法的智能组卷问题探究.安徽大学工学硕士论文, 2011.[12] 杨葳.基于OLAP的成绩分析系统的研究.沈阳工业大学工学硕士论文, 2007.[13] 刘剑.改进聚类分析算法及其在成绩分析中的应用研究.大连交通大学工学硕士论文,2008.[14] 牛文颖.改进的ID3决策树分类算法在成绩分析中的应用研究.大连交通大学工学硕士论文, 2008.[15] 黄芳.基于数据挖掘的决策树技术在成绩分析中的应用研究.山东大学工学硕士论文,2009.[16] 刘海燕.基于决策树分类算法的学习成绩分析系统的设计与实现.电子科技大学工学硕士论文, 2011.[17] 汪晓飞.基于多维编码方案的遗传算法在高校排课系统中的应用.四川师范大学工学硕士论文, 2008.[18] 朱奉梅.遗传算法在高校排课系统中的研究与应用.东北大学工学硕士论文, 2009.[19] 王永刚.基于矩阵判别算法的高校自动排课系统设计与实现.电子科技大学工学硕士论文, 2010.[20] 王霞.基于多策略算法排课系统研究.西北农林科技大学工学硕士论文, 2010.[21] 刘震.基于关联规则算法的排课系统的应用研究.大连交通大学工学硕士论文, 2011.[22] Qinghua Hu, Lei Zhang, David Zhang, Wei Pan, Shuang An, Witold Pedrycz.Measuring relevance between discrete and continuous features based on neighborhood mutual information.Expert Systems with Applications, 2011, 38(9): 10737-10750.[23] Haihong Zhang, Cuntai Guan, Yuanqing Li.A linear discriminant analysis method based on mutual information maximization.Pattern Recognition, 2011, 44(4): 877-885.[24] Ai-Hua Jiang, Xiu-Chang Huang, Zhen-Hua Zhang, Jun Li, Zhi-Yi Zhang, Hong-Xin Hua.Mutual information algorithms Original.Mechanical Systems and Signal Proceing, 2010, 24(8): 2947-2960.[25] Sombut Foithong, Ouen Pinngern, Boonwat Attachoo.Feature subset selection wrapper based on mutual information and rough sets.Expert Systems with Applications, 2012, 39(1): 574-584.[26] Ju Lynn Ong, Abd-Krim Seghouane.Feature selection using mutual information in CT colonography.Pattern Recognition Letters, 2011, 32(2): 337-341.[27] Sangjae Lee.Using data envelopment analysis and decision trees for efficiency analysis and recommendation of B2C controls.Decision Support Systems, 2010, 49(4): 486-497.[28] Fernando E.B.Otero, Alex A.Freitas, Colin G.Johnson.Inducing decision trees with an ant colony optimization algorithm.Applied Soft Computing, 2012, 12(11): 3615-3626.[29] Siva S.Sivatha Sindhu, S.Geetha, A.Kannan.Decision tree based light weight intrusion detection using a wrapper approach.Expert Systems with Applications, 2012, 39(1): 129-141.[30] Mehmet Ali Cavuslu, Cihan Karakuzu, Fuat Karakaya.Neural identification of dynamic systems on FPGA with improved PSO learning.Applied Soft Computing, 2012, 12(9): 2707-2718.[31] B.Vasumathi, S.Moorthi.Implementation of hybrid ANN–PSO algorithm on FPGA for harmonic estimation.Engineering Applications of Artificial Intelligence, 2012, 25(3): 476-483.[32] Haiyan Lu, Pichet Sriyanyong, Yong Hua Song, Tharam Dillon.Experimental study of a new hybrid PSO with mutation for economic dispatch with non-smooth cost function.International Journal of Electrical Power & Energy Systems, 2010, 32(9): 921-935.[33] Amitava Chatterjee, Fumitoshi Matsuno.A Geese PSO tuned fuzzy supervisor for EKF based solutions of simultaneous localization and mapping(SLAM)problems in mobile robots.Expert Systems with Applications, 2010, 37(8): 5542-5548.[34] U.Fayadd, Piatesky, G.Shapiro, and P.Smyth, From data mining to knowledge discovery in databases, AAAI Pre / The MIT Pre, Maachusetts Institute Of Technology.ISBN 0–262 56097–6, 1996.[35] J.Han and M.Kamber, “Data Mining: Concepts and Techniques,” Morgan Kaufmann, 2000.[36] S.T.Hijazi, and R.S.M.M.Naqvi, “Factors affecting student‟s performance: A Case of Private Colleges”, Bangladesh e-Journal of Sociology, Vol.3, No.1, 2006.[37] Z.N.Khan, “Scholastic achievement of higher secondary students in science stream”, Journal of Social Sciences, Vol.1, No.2, pp.84-87, 2005..[38] Galit.et.al, “Examining online learning procees based on log files analysis: a case study”.Research, Reflection and Innovations in Integrating ICT in Education 2007.[39] Q.A.AI-Radaideh, E.W.AI-Shawakfa, and M.I.AI-Najjar, “Mining student data using decision trees”, International Arab Conference on Information Technology(ACIT'2006), Yarmouk University, Jordan, 2006.[40] U.K.Pandey, and S.Pal, “A Data mining view on cla room teaching language”,(IJCSI)International Journal of Computer Science Iue, Vol.8, Iue 2, pp.277-282, ISSN:1694-0814, 2011.[41] Shaeela Ayesha, Tasleem Mustafa, Ahsan Raza Sattar, M.Inayat Khan, “Data mining model for higher education system”, Europen Journal of Scientific Research, Vol.43, No.1, pp.24-29, 2010.[42] M.Bray, The shadow education system: private tutoring and its implications for planners,(2nd ed.), UNESCO, PARIS, France, 2007.[43] Vashishta, S.(2011).Efficient Retrieval of Text for Biomedical Domain using Data Mining Algorithm.IJACSA-International Journal of Advanced Computer Science and Applications, 2(4), 77-80.[44] Collier, K., Carey, B., Sautter, D., and Marjaniemi, C., “A methodology for evaluating and selecting data mining software,” in Proceedings of the 32nd Annual Hawaii International Conference on System Sciences, IEEE, 1999.Orange, University of Ljubljana, Slovenia, [45] Luan, J., Zhao, C.-M., and Hayek, J., “Exploring a new frontier in higher education research: A case study analysis of using data mining techniques to create NSSE institutional typology,” Paper presented at the California Aociation for Institutional Research, Anaheim, California, November 17-19, 2004.[46] Bekele, R.and Menzel, W., “A Bayesian approach to predict performance of a student(BAPPS): A case with Ethiopian students,” in Proceedings of the International Conference on Artificial Intelligence and Applications(AIA-2005), Vienna, Austria, 2005.[47] Minaei-Bidgoli, B., Kashy, D.A., Kortemeyer, G., and Punch, W.F, “Predicting student performance: an application of data mining methods with an educational web-based system,” in Proceedings of 33rd Annual Conference on Frontiers in Education(FIE 2003), volume 1, 2003, pages 13–18.[48] Romero, C., Ventura, S.(2007).Educational Data Mining: A Survey from 1995 to 2005.Expert Systems with Applications 33, 2007, pp.135-146.[49] Ma, Y., Liu, B., Wong, C.K., Yu, P.S., Lee, S.M.(2000).Targeting the right students using data mining.Proceedings of the sixth ACM SIGKDD international conference on Knowledge discovery and data mining, Boston, pp 457-464.[50] Luan, J.(2002).Data Mining and Its Applications in Higher Education.New Directions for Institutional Research, Special Iue titled Knowledge Management: Building a Competitive Advantage in Higher Education, Vol.2002, I.113, pp.17–36.[51] Luan, J.(2004).Data Mining Applications in Higher Education.SPSS Executive Report, SPSS Inc.[52] Minaeli-Bidgoli, B., Kashy, D., Kortemeyer, G., Punch, W.(2003).Predicting Student Performance: An Application of Data Mining Methods with the Educational Web-Based System LON-CAPA.33rd ASEE/IEEE Frontiers in Education Conference, 5-8 Nov 2003, Boulder, CO.[53] Kotsiantis, S., Pierrakeas, C., Pintelas, P.(2004).Prediction of Student’s Performance in Distance Learning Using Machine Learning Techniques.Applied Artificial Intelligence, Vol.18, No.5, 2004, pp.411-426.[54] Pardos Z., Heffernan N., Anderson B., and Heffernan C.(2006).Using Fine-Grained Skill Models to Fit Student Performance with Bayesian Networks.In Proceedings of the Workshop in Educational Data Mining held at the 8th International Conference on Intelligent Tutoring Systems(ITS2006), June 26, 2006, Taiwan.[55] Superby, J.Vandamme, J., Meskens, N.(2006).Determination of factors influencing the achievement of the first-year university students using data mining methods.Proceedings of the Workshop on Educational Data Mining at the 8th International Conference on Intelligent Tutoring Systems(ITS 2006).Jhongli, Taiwan, pp37-44.[56] Vandamme, J., Meskens, N., Superby, J.(2007).Predicting Academic Performance by Data Mining Methods.Education Economics, 15(4), pp405-419.[57] Cortez, P., Silva, A.(2008).Using Data Mining to Predict Secondary School Student Performance.EUROSIS, A.Brito and J.Teixeira(Eds.), 2008, pp.5-12.Dekker, G., Pechenizkiy, M., Vleeshouwers, J.(2009).Predicting Students Drop Out: A Case Study.Conference Proceedings of the 2nd International Conference on Educational Data Mining(EDM’09), 1-3 July 2009, Cordoba, Spain, pp.41-50.