无标题文档
|
|
|
|
|
|
|
|
下一代互联网
  当前位置:EDU首页 > 教育信息化(旧) > 中国教育网络新版 > 网络应用 > 数字校园
信息资源规划系列之数据标准与数据管理
http://www.media.edu.cn 2008-06-19 中国教育网络 作者:高复先

为了开发利用高校的信息资源,必须建立高校的信息资源管理(IRM)基础标准。这些基础标准决定着信息系统的质量和效率,因而也是进行信息资源开发利用的最基本标准。我们在实践的基础上总结出信息资源管理基础标准即一些数据标准,包括:数据元素标准、信息分类编码标准、用户视图标准、概念数据库标准和逻辑数据库标准。这些标准将构成高校信息化建设的数据标准化体系,在信息资源开发利用、信息系统建设和运行使用中都具有极其重要的基础性作用。

  

建立数据标准的重要性和原则

 

威廉·德雷尔(William  Durell)1985年出版的专著《数据管理——成功的数据管理实践指南》(DATA ADMINISTRATION:A Practical Guide to Successful Data Management)总结了信息资源管理的基础—数据管理标准化方面的经验。他的名言是:没有卓有成效的数据管理,就没有成功高效的数据处理,更建立不起来全组织的计算机信息系统。他认为,早期的计算机信息系统开发,缺乏关于数据结构的设计和管理方面的科学方法,直到近十年(指上世纪80年代),才对这些问题加以认真地考虑。信息系统设计人员了解和掌握数据标准,就像建筑设计师了解和掌握建筑材料标准一样重要,否则,是设计不好信息系统的。

 

为了有效地制定和实施数据标准,威廉提出了一些重要的原则:

第一,数据标准的制定要从实际出发,要以共同看法为基础;

第二,数据标准要简明易懂,切实可行;

第三,标准必须加以宣传推广,而不是靠强迫命令;

第四,管理部门保障标准的执行,有纠正违背标准的办法;

第五,标准应该逐渐地制定出来,不要企图把所有的数据标准一次搞完;

第六,数据管理最重要的标准是一致性标准——数据命名、数据属性、数据设计和数据使用的一致性。

  

数据元素标准

 

数据元素(Data Elements)是最小的不可再分的信息单位,是一类数据的总称。信息系统中的“职工姓名”、“员工姓名”、“职员姓名”等,如不加以统一,在用汉语拼音表示其标识时就有ZGXM、YGXM、ZYXM等;而其英文标识就可能是EMP-NAME、NAME-OF-EMPLOYEE、EMPLOYEE-NM、EMP-NM等。如果统一采用“职工姓名”,其标识为ZGXM或EMP-NM,这就是少数的“标准化”数据元素;如果开发人员都这样做,就可大幅度减少信息系统中所使用的数据元素总数,并可大大简化其结构。数据元素的质量是建立坚实数据结构的基础。在数据元素的创建和命名上做整体的考虑,借鉴对化学元素的研究,就可以把握信息系统中有限数目的“核心”数据元素,这就需要建立数据元素标准——数据元素命名、标识标准和一致性标准。

 

命名规则

 

数据元素命名的规则是用一简明的词组来描述一个数据元素的意义和用途。这个词组的一般结构是:

 

例如:“社会保险号码”(SOCIAL-SECURITY-NUMBER)是一个数据元素,其结构是:

 

类别词(class word)是指能对数据对象作一般性分类的词,例如“时间”、“编号”等;基本词(prime word)是指能对数据对象做进一步分类的词,例如“设备”、“保险”等;修饰词(modifying word)一般是名词,而不是形容词或副词。类别词是数据元素命名中一个最重要的名词,用来识别和描述数据元素的一般用途或功能,不具有行业特征,条目比较少。基本词是对一大类数据对象做进一步分类(反映一小类数据对象),一般具有行业特征,条目比较多。把握类别词与基本词的定义和数目,就能控制数据元素的定义准确性和总体数目。

 

注意:数据元素作为最小的不可再分的信息单位,其命名词组要说明抽象数据的逻辑属性,而不包括物理属性,即不得包括时间、空间和人员单位等属性。以“授课人数”这一数据元素为例,某天的授课人数、某教室的授课人数、某教授的授课人数等,都不再是数据元素。

 

标识规则

数据元素标识即数据元素的编码,是计算机和管理人员共同使用的标识。数据元素标识用限定长度的大写字母字符串表达,字母字符可按数据元素名称的汉语拼音抽取首音字母,也可按英文词首字母或缩写规则得出。

 

一致性控制

数据元素命名和数据元素标识要在全组织中保持一致,或者说不允许有“同名异义”的数据元素,也不允许有“同义异名”的数据元素。这里的“名”是指数据元素的标识,“义”是指数据元素的命名或定义。

例如,“同名异义”的数据元素有:

 

这是因为没有遵循数据元素标识规则,用两个字符来标识数据元素(过于简单)的结果。如果坚持汉语拼音或英文缩略的数据元素标识规则,就消除了“同名异义”现象:

 

数据元素的“同义异名”的例子,如前面提到的“职工姓名”和“员工姓名”的标识分别是ZGXM和YGXM,还有“单位编码”和“单位号码”的标识分别是DWBM和DWHM等,实际上是对同一个数据元素用了不同的标识。

 

建立高校的数据元素标准,是指按上述规则识别定义出所有的数据元素(一般在2000多个左右),由所有应用系统共同使用。

  

页面功能 【字体:   】 【打印】 【关闭】 【联系我们
无标题文档
主管单位:中华人民共和国教育部  主办单位:教育部科技发展中心  承办单位:中国教育和科研计算机网CERNET
《中国教育网络》编辑部 京ICP证060236号 联系电话:010-62603869
建议使用800*600分辨率及Microsoft IE5.0版本以上浏览器
copyright © 北京赛尔时代传媒文化有限公司 All Rights Reserved