【摘 要】现代远程教育的全过程基本上都是通过浏览网站的形式进行的,学生在Web上的行为都会产生大量的信息,这些信息在远程教育的全过程中十分宝贵,充分挖掘这些信息及其背后潜在的信息,反馈来指导远程教育中的各个环节,以此来扩大影响、吸引招生、为学生提供个性化的服务内容,增强远程教育的竞争力。
【关键词】数据挖掘;现代远程教育;应用
【中图分类号】TP399 【文献标识码】A 【文章编号】1008-1151(2006)05-0093-02
一、数据挖掘技术概述
(一)数据挖掘(Data Mining)定义
数据挖掘就是从大量存储的数据中,利用模式识别、统计和数学的技术,筛选发现新的有意义的关系、模式和趋势的方法。就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它主要依靠人工智能、机器学习和统计学技术,对数据进行归纳推理,从中挖掘出潜在的模式,预测未来趋势,为决策提供支持。
(二)数据挖掘技术发展及现状
1989年8月第11届国际人工智能联合会议的专题讨论会上首次出现KDD(Knowledge Discovery In Database)——数据库中的知识发现这个概念,泛指所有从数据中挖掘模式或联系的方法,1995年第一届知识发现和数据挖掘(Data Mining)大会,使得数据挖掘这个概念被广泛认知,每年KDD都要举办一次国际会议,并在1997年拥有了自己的会刊“Knowledge Discovery and Data mining”。
目前,国内外数据挖掘的研究方向及其发展趋势主要集中在对Bayes(贝叶斯)方法及Boosting方法的研究和提高、传统的统计学回归法在KDD中的应用、KDD与关系型数据库的联系等方面。而数据挖掘应用技术潜在的应用十分广泛,在电子商务、银行、电信等多个领域,依靠Web数据挖掘技术可以有效地提高Internet站点和客户的关联性,而随着Internet的广泛应用,数据挖掘的对象也延伸到了网络Web上的数据,这就又出现了一个新的研究领域KDW(Knowledge Discovery in Web),由于Web数据的半结构化的特点,KDW的难度要高于KDD。
二、数据挖掘在现代远程教育个性化服务中的应用
现代远程教育是随着现代信息技术的发展而产生的一种新型教育形式,其基本特征是利用计算机网络和多媒体技术,提供丰富的教学资源供学习者选用,教学形式由原来的以教为主变为以学为主。现代远程教育系统虽然自身信息量巨大,但是Web浏览的内容形式、网站的设计、学习的流程都是相对固定的,教学方法与教学模式单一,造成了学员个体的差异与固定教育模式两者之间的矛盾。
(一)个性化服务的概念
个性化服务就是用户可以根据自身的需求“定制”自己所需要的信息,而远程教育网站则根据用户的需求、兴趣爱好、能力差异等特点,智能化地为用户选择对应的学习资源,提供智能化的学习指导和答疑等全方位的服务,并根据用户的需求变化,动态地改变所提供的资源信息和服务内容。也就是说,每一位用户在访问同一个网站时,他所看到的页面和信息资源是不同的。用户输入感兴趣的内容后,网站自动对页面的表现形式进行剪裁和改动,而且这个过程是由用户控制的。像Yahoo.com、Iwon.com就允许用户选择何种信息怎样显示在他们的个性化页面上。Yahoo的用户可以选择特定类型的新闻显示在他们的my.yahoo.com页面上。而网站系统则通过机器学习来观察用户的访问行为,利用数据挖掘技术掌握用户以前的访问行为,预测今后的访问趋势,从而达到自适应的目的。个性化的远程教育服务是一个具有人工智能的服务系统,可以更多且及时地了解到学生的状况、需求、能力差异、学习进度、兴趣爱好,并动态地根据这些因素调整学生的培养计划和学习进度,有针对性地进行学习,这就是现代远程教育应用的新模式。
(二)个性化服务中的数据挖掘过程