Web挖掘技术在网络教学的应用

来源：免费论文网　|　时间：2017-11-04 10:31:46　|　移动端：Web挖掘技术在网络教学的应用

Web挖掘技术在网络教学的应用 本文关键词：挖掘，教学，技术，网络，Web

Web挖掘技术在网络教学的应用 本文简介：摘要对传统网络教学模式进行了扩展和改进，利用Web挖掘技术，挖掘受教育者的兴趣点和需求点，并通过关联规则分析中的Apriori算法生成受教育者所需的学习内容页面集合，为受教育者提供个性化网络教学服务，使受教育者获得较好的用户体验。关键词Web挖掘技术；Web日志挖掘；网络教学；个性化；Apriori

Web挖掘技术在网络教学的应用 本文内容：

摘要对传统网络教学模式进行了扩展和改进，利用Web挖掘技术，挖掘受教育者的兴趣点和需求点，并通过关联规则分析中的Apriori算法生成受教育者所需的学习内容页面集合，为受教育者提供个性化网络教学服务，使受教育者获得较好的用户体验。

关键词Web挖掘技术；Web日志挖掘；网络教学；个性化；Apriori算法

引言

当今，Internet技术、信息技术的飞速发展触动了社会的各个行业，教育领域中传统的教学方式深受高新技术的影响，发生了巨大变革，出现了新型的、学习内容数字化、教学方式网络化的网络教学模式。网络教学使教师和学生摆脱了时间、空间的限制，提供了一种快速便捷的信息传递、信息接收的途径。但在网络教学快速发展的过程中，逐渐涌现出一些不可忽视的问题。特别是，受教育者通过网络教学平台获得的学习资源“千人一面”，系统不能根据学习者的能力、兴趣、进度等因素提供个性化、符合其学习需求的学习内容，使其学习效果未得到明显提升，从长远看，必将影响网络教学平台的用户黏性。本文将传统的网络教学模式与Web挖掘技术相结合，利用Web挖掘技术中的Web日志挖掘技术，根据受教育者在学习过程中保留在Web服务器中的访问日志记录，挖掘关于受教育者的学习兴趣、学习特征、学习需求等方面的重要信息，为不同的受教育者生成有针对性的、内容各异的页面推荐集合，实现网络教学的个性化。

1Web挖掘技术

1.1数据挖掘技术与Web挖掘技术

传统的数据挖掘技术，是指在大量、无序的原始数据中，捕获先前未知的有用模式的过程[1]，其处理的对象是结构化的数据。Web挖掘技术以数据挖掘技术为基础，应用领域延伸至网络，将其处理对象的范围扩大至非结构化的数据，包括Web服务器及各类文档的信息，比如weblog、文本、视频、图片等，运用相关算法进行分析，发现隐含的、有意义的模式。Web挖掘可分为Web内容挖掘、Web结构挖掘及Web日志挖掘。Web内容挖掘主要处理网页的内容，包括文本挖掘和多媒体挖掘[2]。Web结构挖掘是对网络文档结构及各个页面之间的相互联系进行深入学习，提取有用的信息。Web日志挖掘则以用户访问网站时留在web服务器和客户端的信息为对象，采用聚类分析、关联规则分析等技术，挖掘出有价值的模式。

1.2Web日志挖掘技术

Web日志挖掘技术处理的对象涵盖了用户的注册信息、服务器日志记录、用户查询记录和Cookies日志等数据[3]。但这些原始的日志文件并不适合直接进行挖掘，须经历一定的处理过程。Web日志挖掘具体由四部分组成：原始数据收集、数据预处理、挖掘过程和模式分析[4]。见图1。传统的网络教学的设计思想是利用互联网的技术，将教育资源与受教育者联系起来，受教育者通过访问网络教学平台，自行选择课件、习题、试题等学习资源。网络教学模式的出现为受教育者提供了很大的方便，但由于在学习平台的构建时缺乏对受教育者个性化的考虑，以致平台展现给每个受教育者的信息虽然在种类和数量上都很丰富，但却不能做到因人而异、因材施教，受教育者通过网络教学获得的服务也较为单一，不能快速获得符合自己兴趣和能力需求的学习内容。为此，应对中间层的网络教学平台进行详细设计和进一步扩展，充分考虑受教育者的需求并满足各个受教育者的不同需求，提供智能化服务。通过建立一个以Web日志挖掘技术为载体的网络教学模型，以服务器端的Web日志文件记录的受教育者的个人注册信息、浏览内容、访问路径等信息为对象，利用相关的算法，实现对学习资源的聚类、用户的聚类并生成用户浏览模式集合，再利用个性化推荐系统将符合受教育者个性特点的学习内容呈现给相应的用户，使受教育者在最短时间内获得了所需的课件、习题、试题、视频等资料集合，在提高学习效率的同时也使受教育者的学习体验得到很好的改善。具体模型见图2。

2算法分析

在图2所示的网络教学模型中，Web日志挖掘模块是核心，实现对受教育者、页面的聚类以及受教育者学习规律的总结分析。聚类分析、关联规则分析是该模块重要的技术手段。聚类分析主要实现对页面和受教育者的聚类。页面聚类是将被受教育者频繁访问、相似度较高的学习资源聚为一类，以便在受教育者学习某个知识点时为其推送同类资源，缩小了推荐系统的查找范围。对受教育者聚类是通过跟踪Web日志中受教育者的学习行为、学习过程，将个性特点、学习习惯相似的受教育者聚为一类，分析各类受教育者对知识点的掌握情况，针对性地为每一类受教育者定制相应的教学资源，使受教育者能够按需学习，提高学习效果。而关联规则分析则是根据Web日志中受教育者对网页的浏览记录，用相关技术挖掘出有价值的网页集合。从挖掘结果可知哪些路径被受教育者频繁访问，可掌握受教育者的学习需求并预测受教育者的学习趋势，同时完善页面之间的链接，使受教育者快速访问到所需的学习资源。以关联规则分析为例，涉及到的算法主要有Apriori算法、FP增长算法等。本文以Apriori算法为例，实现对受教育者访问频繁网页的挖掘，最终生成学习内容页面推荐集合。Apriori算法相关术语设S={s1,s2,…,sd}是所有项的集合,T={t1,t2,…,tK}是所有事务的集合,每个事务ti包含的项集都是S的在子集。项集X、Y均是ti的子集。X∩Y=Φ.将蕴涵表达式X→Y称为T的关联规则。衡量关联规则的强弱有两个主要的指标，分别是支持度、置信度。支持度确定规则可以用于给定数据集的频繁程度，而置信度确定Y在包含X的事务中出现的频繁程度[5]。设定min-sup和min-conf为最小支持度阈值及最小置信度阈值，若T中存在关联规则X→Y，使得以下两个式子同时成立：support(X→Y)≥min-supconfidence(X→Y)≥min-conf则X→Y被称为T事务的强关联规则。找出全部强关联规则是关联规则分析的最终目标。关联规则分析中的项集是指包含0个或多个项的集合。若一个项集由k个项组合而成，则称为k-项集。满足最小支持度阈值的项集称为频繁项集[6]。频繁k-项集的集合通常记为Fk.将产生频繁k-项集Fk的候选k-项集标记为Ck。Apriori算法是最早、也是最成熟的关联规则挖掘算法[7]。该算法分两步：第一步，发现满足最小值尺度阈值的所有项集，产生频繁项集；第二步：从上一步发现的频繁向集中提取所有高置信度的规则，即强关联规则。Apriori算法运行过程设M是对服务器日志进行预处理后得到的事务数据库，记录了6个学习者对网络教学平台访问的网页路径，如表1所示。由此可见，{H1,H3,H4,H5}是被受教育者访问频率较高的网页组合。可以在这些网页间增加链接，使站点结构更完善，也可将这些网页形成学习内容集合直接推送给学习相关知识点的受教育者，帮助其提高学习效率。

3结语

在传统的网络教学模式上引入Web挖掘技术，解决了以往存在的所有受教育者接收到的知识信息不能因人而异、学习模式过于单调的问题，实现了千人千面的网络教学模式，为受教育者创造了良好的网络教学环境，有利于调动受教育者的积极性，使网络教学的效果更加显著。

参考文献

[1]张春明.Web挖掘技术研究[J].廊坊师范学院学报(自然科学版),2008,(05):35-36.

[2]李雪竹,王锋.Web数据挖掘研究[J].电脑知识与技术(学术交流),2007,(18):1502+1505.

[3]赵培鸿.Web数据挖掘综述[J].无线互联科技,2013,(02):6-7.

[4]顾兆军,李晓红,王伟,黄杰培.Web日志挖掘中的会话识别方法研究[J].计算机技术与发展,2012,22(04):45-49.

[5]基于关联规则的购物篮分析[J].四川理工学院学报(自然科学版),2010,23(04):430-434.

[6]刘振宇,徐维祥.多支持度关联规则在库存管理中的应用[J].内蒙古大学学报(自然科学版),2012,43(03):313-318.

[7]张井.高维数据子空间聚类算法研究[D].天津大学,2012.

作者：梁燕红

《Web挖掘技术在网络教学的应用》由：免费论文网互联网用户整理提供；
链接地址：http://www.csmayi.cn/show/211051.html
转载请保留,谢谢!

上一篇：高校英语教学实施创新教育的策略
下一篇：高职休闲体育专业创新教育发展探索

推荐专题

相关文章

1Web挖掘技术在网络教学的应用

最新文章