无标题文档
|
|
|
|
|
|
|
|
下一代互联网
  当前位置: 首页 > 网络应用 > 远程教育 >
基于web的数据挖掘在远程教育中的应用
http://www.media.edu.cn 中国教育网络 作者:张建宇 叶长青

1998 年教育部批准清华大学等四校开展现代远程教育试点起, 或从2000 年“教育部现代远程教育试点经验交流会”正式启动重点大学的试点之后,中国远程教育以毋庸置疑的姿态进入第三个阶段,即开放灵活的远程学习(丁兴富,1992)。“服务”的办学理念悄然兴起,不断地深入人心,构建“沃尔玛”式的教育超市成为远程教育机构的梦想。“沃尔玛”超市为市民提供便利快捷个性化的服务启发着教育者们构筑具有其品牌效果的远程教育连锁超市。为学生提供优质的个性学习支持服务成为当前热烈讨论的话题,“个性化授导”应运而生。那么我们该怎样使这一理念付诸于实践,怎样在实践层面上“拿来”有效的技术支撑个性化服务?本文旨在讨论把基于wed的数据挖掘技术应用于远程教育个性化授导的空间,通过获取学习者在web上的学习过程行为数据,如访问频度、内容、访问时间长短及偏好等,经过模式处理,得出学习者学习过程的一般模式规律,以此为学习者提供良好的个性化服务,使学习者更好地发展自我。

 

基于web的数据挖掘

 

基于web的数据挖掘是将web的使用与传统的数据挖掘结合起来,来获取web知识的过程。一般来说,基于web的数据挖掘按照挖掘的对象不同,可以分为web内容挖掘、web结构挖掘及web使用挖掘。

 

web内容挖掘是指对Web页面内容及后台交易数据库进行挖掘,从Web文档内容及其描述中的内容信息中获取有用知识的过程。

 

web结构挖掘是从人为的链接结构中获取有用的知识。由于文档之间的互连,WWW能够提供除文档内容之外的有用信息。利用这些信息,可以对页面进行排序,发现重要的内容页面,重新组织内容结构,使内容逻辑结构更加合理。

 

web使用挖掘是主要通过挖掘相应站点的日志文件获取学习者的访问内容、停留时间、访问频度等,发现其学习访问模式等有用信息的过程。

 

挖掘流程

 

基于web的数据挖掘一般流程经过数据的采集、预处理、模式发现、模式的分析及其应用几个过程。

 

数据采集

 

根据挖掘的目的明确收集学习者什么样的数据:web内容挖掘是从web自身资源中收集信息,利用网页自动化分类技术可以用做站点搜索引擎;web结构挖掘从页面内部结构(intra-page)以及页面之间的结构(inter-page)获取资料,包括HTML内部标记和网页之间的链接关系,可以以树的形式记录下来;web使用挖掘从服务器端或者远程代理或者客户端来收集用户使用过程的数据,如IPURLIDTime等。

 

预处理

 

web内容挖掘的预处理:把网页中的文本、图片及其他文件转换成数据挖掘算法可用的形式。

 

web结构挖掘的预处理:对web的页面结构进行分析、变形,使之适用于数据挖掘系统。

 

web使用挖掘的预处理:过滤掉价值不大的信息(如用户访问的传输协议,错误代码等),补充用户完整路径,识别用户(Single IP address/Multi Server Sessons Multiple IP address/Single Server Session/Multiple IP address/Single User Multiple Agent/Single User)和识别事务(可以根据用户跨越页面时间长短来划分事务,也可以根据用户一系列的page view直到退回首页划分为一个会话事务)。

 

模式发现

 

经过数据预处理之后,应用一种合理的挖掘算法或综合应用不同的算法,如关联规则分析、聚类和分类技术、统计分析以及时序模式技术等,来处理“消噪”后的数据,最终发现用户的访问模式。关联规则分析可以发现学习者对内容页面之间的访问关系,调整页面之间的结构关系,预测学习者可能访问的内容,使其最快捷地访问到感兴趣的内容。聚类分析挖掘访问相同页面的相似学习者,可以为其群体提供特定的内容;同时,聚类分析还可以将内容相关的页面归为一个组,为学习者搜索内容提供服务。预先为学习者设定几个类别,利用分类技术将学习者投射到某一个类中,为某特殊类提供特殊的个性化资源和学习支持服务,还可以用于远程协作的学习小组分配。统计分析技术是通过统计学习者经常访问或者访问频繁的内容,发现用户的兴趣倾向,也可以统计非法IP、无效URI 和未授权访问等。这些信息对于提高系统性能,密切注意学习者动向起着辅助决策作用。序列模式可以寻找用户频繁出现的序列,预测学习者行为,把其需要的资源主动提供给他(她),减少系统响应时间。

 

模式的分析和应用

 

通过模式挖掘之后,生成的规则数目庞大,表达晦涩,得不到很好的利用,这就需要对模式进行分析评价,通过模式分析和应用技术处理之,选择学习者易于理解和接受的方式显现出来。经常用到的是可视化技术、联机分析技术和智能查询机制等。利用数据挖掘与学习内容绑定的技术,在学习者学习过程中以可视化方式指导其学习和个性发展。

 

远程教育个性化授导中的数据挖掘

 

学习者特征模型构建

 

根据学习者不同的特征参数,对学生学习活动进行跟踪,记录与学习相关的信息。记录学习者经常访问的URL,跟踪统计学生访问次数、总停留时间、该学生访问的课程数、该学生对哪些课程停留时间较长等,还可统计网站某个时间段内访问的次数、访问次数最多的URL地址、学习者作业的过程、参与讨论的情况、交流用的工具等。通过数据挖掘的去噪和模式发现模块,得到学习者的学习特征风格,建立和完善学习者学习模型,建立学习者个性数据库,为不同的学习者提供合适学习策略提供基础。

 

为学习者提供个性化的学习资源

1 2  下一页
页面功能 【字体:   】 【打印】 【关闭】 【联系我们
相关链接
·网络学习平台在现代教育模式中应用
·Moodle系统在网络教学中应用
·《SPSS》网络课程设计
·考试中心网络仿真技术 教育部考试中心应用案例
·第二语言教学网络平台的应用与分析
无标题文档
主管单位:中华人民共和国教育部  主办单位:教育部科技发展中心  承办单位:中国教育和科研计算机网CERNET
《中国教育网络》编辑部 京ICP证060236号 联系电话:010-62603869
建议使用800*600分辨率及Microsoft IE5.0版本以上浏览器
copyright © 北京赛尔时代传媒文化有限公司 All Rights Reserved