在教学活动中,知识库建设提供了一个知识积累、传播、使用和传承的途径。就像企业家津津乐道的供应链、价值链一样,从知识的生命周期来看,教学活动也存在着一条知识链,各种研究成果、知识积累正是在循环和流转中不断地适应、创造和升华。
自从W3C(World Wide Web Consortium)于2004年2月最终公布了关键技术标准,语义Web技术在各领域的应用引发了业界人士广泛的探讨和尝试,例如Semagix开发的FREEDOM系统等等。从教育领域来说,目前的系统大多集中在教学活动组织和资源规划这些领域,如果能结合语义Web对研究成果进行分析、管理,建设一套重在知识的获取和检索的系统,对教学活动开展、研究开发都会有莫大的帮助作用。
语义Web技术
语义Web是目前万维网的发展方向,它把来自任何网站、使用任何语言、面向任何应用的数据联系起来,并且帮助人们从这些联系中提取知识。语义Web的概念是由万维网的奠基人Berners-Lee在2000年12月的XML2000会议上提出的,目标是在计算机和人类理解的语义之间建立一种联系,用以满足智能软件代理对互联网上异构和分布信息的有效访问和检索。它主要包括下面几个核心层次:
第一层是Unicode和URI,它是整个语义Web的基础,Unicode(统一编码)处理资源的编码,URI(统一资源定位器)负责标识资源;第二层是XML+名空间+XML模式,用于表示数据的内容和结构;第三层是RDF+RDF模式,用于描述资源及其类型;第四层是本体词汇,用于描述各种资源之间的联系;第五层是逻辑,在下面四层的基础上进行逻辑推理操作;第六层是验证,根据逻辑陈述进行验证以得出结论;第七层是信任,在用户间建立信任关系。
RDF(Resource Description Framework)是语义Web的标准语言,它用计算机可以理解的方式表达了短语和概念的含义。RDF在句法中通常使用XML。
另一个关键概念是本体(Ontology),字典中的解释是“关于实体或存在的特定理论”。对于语义Web,本体是一系列描述的集合,使用网络本体语言(Web Ontology Language, OWL)写成,它定义了概念和相关逻辑规则之间的联系。根据应用领域的不同可以创建不同的本体,例如本体A可以把“矛盾”定义成包括内涵和外延的逻辑概念,本体B就可能把它定义成发生在春秋战国的历史典故。
知识镜(Knowledge Lens)
建立知识单元(Knowledge Unit)几乎是所有知识管理系统建设的关键步骤。所谓的知识包括了面向过程、假定和语言三方面的考虑,其中只有一部分在词典、和分类学中已经列出。另外,知识不同于数据和信息,它从很多不同的纬度考察一个概念,而在使用过程中又常常需要聚焦某个方面,完成这个功能的就是知识镜。知识镜在关注的知识领域形成收敛的视图,同时抑制不相关内容,在知识管理领域类似凸透镜的作用提高知识重取(Knowledge Retrieval)的效率。
知识管理系统需求分析
知识管理系统的主要功能可以分为两项:获取知识和利用知识。前者反映在系统开发中就是从上传课件、Q&A(问答库)、作业批复等非结构化数据来源中,通过基于本体的语义分析获取知识,形成结构化知识信息,最终这个知识库中的知识储备量将相当于一个教师的知识储备量,甚至超过教师。系统在不断的“答疑”过程中,能够把知识库中不存在的知识发给真正的教师,教师集中解答后的答案会自动地储备到知识库中,即知识库是动态更新的。
知识获取是利用的基础。随着结构化知识信息储备的累积,基于本体技术的搜索引擎依靠语义分析,可以提供更加准确快捷的搜索结果。基于知识检索功能,系统还可以满足包括智能浏览、知识联系、导航、提醒等相关功能。
需要注意的是知识获取者不一定是真正的用户,它也代表了某一个功能组件,或是来自外部的另一个系统。
知识获取模块分析
本体库位于整个系统的中心,系统两大功能——知识获取和查询都是围绕着本体库的建设进行,知识获取是一个把非结构化、半结构化和现有结构化数据标准化处理后保存到本体库的过程。知识管理系统本身像是一副鱼骨架(Framework),自动分类程序把非结构化的数据,包括课件、作业、网页等等,源源不断的分析、追加到系统上来,摆在合适的位置。因为本体在计算机结构化数据和人类理解的语义间建立了联系,所以最终的知识检索一系列服务都是智能化的,使用了语义Web技术的系统会知道0375-4835763是个电话号码,而467031就是个邮政编码。再举个例子,假设Smith先生希望了解一些关于Blizzard公司的消息,基于本体技术的支持,系统就不但知道Blizzard Entertainment Incorporation是公司的全名,还知道11-023-659是联系人电话,还有Blizzard所有销售网点的地址和联系电话。
在教学知识管理系统中,知识获取过程就是本体的设计、开发、集成、验证这样一个迭代和增量的过程,以便语义Web根据生成的本体完成教学知识管理各项功能。
首先,设计过程的主要任务是设定问题描述框架、定义范围、定义成功标准和最低标准、调查任务和商业目标以及用例分析。该环节的核心是分析试验,它把上文提到的邮件、课件等文本、图形形式的信息转化为结构化的分析报告。
其次,本体的开发是指对控制词表进行识别和提取,通过集成不同的关系形成概念模型(Conceptual Model)。通过对属性和规则的扩充可以反映带有教学知识管理特色的内容。
再次,本体集成是从每个个体“知识镜”的集成开始的,通过与其它的系统参与者广泛的交流意见,对现有模型进行修改和扩充,把计算性描述转化为RDF、XML或其他的程序化描述,使用OWL-RDF(Web Ontology Language-Resource Description Framework)应用整合LOM。
接着,最终形成代表本体的模型的各个部分需要经过所有的系统参与者进行验证,这个过程中要充分考虑到实施中资源、安全、组织间沟通和目标优先级等个方面的约束条件。在本体的自动搜集、整理过程中系统是根据预先设定的验证条件对现有模型检查的。
最后,本体的开发是个迭代和增量的过程,系统使用中需要不断地完善和修改。换而言之,自动生成的教学本体数据会在使用中得到完善。
知识查询模块分析
知识查询是通过知识镜完成的,知识镜是支持知识的检索、共享通用性的解决方案,它可以从更大的可能集合中过滤、选择需要的信息,读取顶层元数据和次层领域数据获取目标信息。
框架模型分析
系统提供了知识维护和知识查询两个界面,前者使用户可以干预知识获取过程,影响ontology管理子系统的工作;后者通过查询控制类发送查询请求,Ontology管理子系统根据本体语义分析的结果返回LOM(Learning Object Metadata)数据包。Ontology管理子系统可以调用外部数据仓库的接口,根据预定的周期、条件自动检索非结构化、半结构化或是结构化数据进行语义分析后保存在数据管理类操作的数据库中。简单地说该类需要完成如下工作:
第一,处理查询请求,返回LOM数据包;
第二,生成于IEEE LOM标准(IEEE 2002)相吻合可重用的教学组件(e-learning object);
第三,使用OWL-RDF(Web Ontology Language-Resource Description Framework)应用整合LOM,生成完整的本体记录;
第四,调用数据管理接口存储、管理本体记录。
IEEE LOM标准侧重专有名词和数字教育内容的参考模型的定义,因为OWL-RDF是基于逻辑描述的标签语言,可以方便地实现从LOM到OWL-RDF的映射。
外部数据处理实体类保存了到外部数据仓库的接口,结构化分析、过滤后的数据保存在知识数据管理类控制的数据库中。
随着语义Web日新月异的发展,利用其技术优势可以实现教学、科研环节上文档结构化、信息快速检索,解决知识存储、管理、发布和共享等一系列问题。目前在语义Web和标准教学组件(E-learning Object)的整合方面存在很多流派的观点,反映在教学知识管理系统中就是在本体管理子系统设计上的不同,如何进一步提高语义分析、查询的效率,以及语义Web在教学知识管理更广泛的应用途径这些问题有待进一步的探索。 |