GIS资讯 GIS技术 GIS产品 GIS书籍 GIS下载 GIS知识 GIS论文 GIS考研 GIS人物 GIS企业 GIS招聘 GPS相关 RS 相关 3D 相关 测绘相关 GIS博客 招标信息
您当前的位置:GIS资讯小组资讯中心GIS论文 → 资讯内容
Google
中文元数据标准框架及其应用
作者:佚名  来源:本站整理  更新时间:2007-11-16 22:47:41

减小字体 增大字体


文摘本文通过对北京大学数字图书馆中文元数据标准框架的主要内容及应用实例的
介绍阐述了中文元数据标准制定的原则方法和工作流程
关键词元数据 元数据标准 元数据标准框架 中文元数据
一概述
元数据的广泛应用是因现代信息资源处理上的两大挑战而发展起来的一是数字资源
逐渐成为信息资源的主流而这些资源从产生存档管理到使用都远远不同于传统的纸
介质文献二是网络和数字化技术使信息的发表既快又便捷由此而来的海量信息要求有
能与现代计算机技术和网络环境相适应的方便快捷有效的数据发现和获取方法
针对各种信息资源包括传统型信息和其数字复制品或天生的数字信息分别制定
适当的元数据标准为它的管理发现和获取提供一种实际而简便的方法是数字图书馆
建设中首先要开展的工作为了既能兼顾不同资源的特性又能最大程度地实现各类资源
在发现和获取方法上的一致性体现数字图书馆的整体性各元数据标准应当从功能数
据结构格式语义语法等诸多方面保持一致这种一致性和整体性也便于在更大范围内
实现不同数字图书馆或说不同系统间的互操作和数据共享
国外在元数据方面的研究工作开展较早已有许多元数据标准被广泛采用我国的元
数据研究与应用也取得不少成果对一些具备中国文化特色的信息资源或是直接采用现
成的元数据标准通过制订详细著录规则的方法来处理或是借鉴其它元数据的成功经验
制订相应的新的元数据标准
北京大学数字图书馆的元数据研究项目中视具体资源对象特点的不同分别采用这
两种方法来开展工作为了实现前面所说的各元数据标准间的一致性和整体性我们在对
大量现行元数据标准和相关研究成果的分析吸收的基础上通过实践总结出一套规范和
指导各类元数据标准的设计制定规则和方法称为中文元数据标准框架以下简称标
准框架该标准框架初稿完成于2001 年1 月7 月又作了进一步修订现已成为北京大
学数字图书馆后续一系列元数据标准制定工作的规范性文件
下图简要揭示了元数据标准框架元数据标准元数据间的关系与作用


此主题相关图片如下:
按此在新窗口浏览图片

本文将对标准框架的主要内容及其实践应用逐一简要介绍为避免发生歧义在
介绍标准框架的内容之前先对本文涉及的几个术语作一定义
元数据的一般定义是元数据是关于数据的数据(data about data)
本文对元数据定义是元数据是描述一个具体的资源对象并能对这个对象进行定位
管理且有助于它的发现与获取的数据一个元数据由许多完成不同功能的具体数据描述
项构成具体的数据描述项又称元数据项元素项或元素
元数据标准是描述某类资源的具体对象时所有规则的集合不同类型的资源可能会有
不同的元数据标准它一般包括了完整描述一个具体对象时所需要的数据项集合各数据
项语义定义著录规则和计算机应用时的语法规定
中文元数据标准指基于具有中国文化特点的信息资源而产生的元数据标准
元数据标准框架是规范设计定制某类特定资源所用的元数据标准时需要遵照的规则
和方法它是抽象化的元数据它从更高层次上规定了元数据的功能数据结构格式
设计方法语义语法规则等多方面的内容
二 元数据标准的设计原则
制定元数据标准应当从三个方面的调查分析入手即著录者包括专业和非专业编
目人员以及管理者使用者指数字图书馆的用户著录对象即被描述的资源在标
准制定过程中要充分考虑前两者的需求和后者的特性并在其间做一最佳平衡和组配
在此基础上要遵循的几组最基本的设计原则是
简单性与准确性原则简单性主要指设计的元数据标准在著录实践时应较为简单易
于掌握尤其要考虑到著录人员除编目员外更多的是相关专业人士如古籍专家地理
学家甚至研究生等但一味追求简单性易导致标引不够精确会降低检索结果的准确度和
精度因此同时要考虑到简单化可能导致的不准确需在二者中作一权衡
专指度与通用性原则由于元数据应用的各类资源的各自特性不尽相同著录深度如
书目内容和插图等和广度指相关联的一组文献作总体著录不尽相同因此无法
只使用一种元数据标准需要根据具体的资源实体来确定相应的元数据标准另一方面
也必须考虑到确定的某种标准应尽可能覆盖多种相似或有相近特性的对象以减少专业
或非专业编目人员在选用适当元数据标准时的人为误差即必须考虑元数据标准在一定
范围内的通用性
互操作性与易转换性原则元数据的互操作性体现在对异构系统间互操作能力的支持
即在北京大学数字图书馆设计的各种元数据标准下建立的元数据不仅能方便地为自己建
立的各相关应用系统所操作还应尽可能地为其它组织或机构所建立的应用系统所操作
在具体应用上互操作性表现为易转换性即在所携信息损失最小的前提下可方便地转
换为其它系统常用的元数据这要求在设计元数据标准时要非常慎重地考虑元数据标准定
义的元素的语义定义和元数据结构两个重要的方面其中与目前较为通行的被广泛支持
的元数据标准如Dublin Core 等的语义定义一致更为重要
可扩展性原则由于数字图书馆将要处理的数字资源非常广泛而各类应用背景更为
复杂元数据标准只能提供最广泛意义上的描述一些特殊应用背景的性质内容并不纳入
但一些具体应用可能会要求更为细致精确的描述应允许使用者在不破坏已规定的标准内
容如元素的语义定义的条件下扩充一些元素子元素或属性值元数据标准中应为
这种应用提供指导性原则
用户需求原则制定元数据标准的目的是想向用户更好和更充分地揭示信息资源因
此用户需求应作为最终的权衡标准特别是在结构与格式的设计元素的增加与取舍语
义规则的制定等方面要尽可能地从用户的角度出发增加系统与用户间的交互渠道如
数据的不同因此标准框架侧重强调了描述型元数据的结构及其元素组成而对于管
理型元数据则参照OAIS 模型仅规定了其基本结构限于篇幅在此不作详细描述应
用型元数据主要视其具体应用而定
1. 描述型元数据descriptive metadata
用于描述或标识对象内容和外观特征的元数据
在本标准框架中目前以文献document 或类文献document-like 为基础的
资源对象所使用的描述性元数据是基于Dublin Core 发展的由以下三个层次组成
– 核心元素core element 采用了Dublin Core 的大部分元素在各类资源对象中通用
拟在该层上与其它系统进行交换支持通用的检索工具故应用时凡支持该标准框
架的系统须严格遵守其元素语义定义
– 本馆核心元素local core element 根据本地资源对象特点参照其它元数据标准制
定在本地数字图书馆系统的各类对象中通用应用时要求在本地系统内部遵守其元
素定义不同的系统可有不同的元素设置及其语义定义
– 个别元素unique element 以某种类型的资源对象为基础制定仅适用这类对象
不用于交换应用时仅要求该对象遵守其定义


此主题相关图片如下:
按此在新窗口浏览图片

这三个层次的划分目的是为了在保证各标准的一致性与整体性的基础上最大限度地
体现不同系统和不同资源的特征给予使用标准框架的标准制订者以最大的自由度
有利于标准的推广使用


此主题相关图片如下:
按此在新窗口浏览图片


此主题相关图片如下:
按此在新窗口浏览图片

标准框架中关于核心元数据集的说明
(1) 核心元素集中元素的语义不允许有交叉
(2) 对采用的Dublin Core 元素应用时不修改其语义
(3) 不同的元数据标准可以根据对象特点制定各自所需的子元素或限定词但必须与本框
架中核心元数据集的语义定义保持严格一致
标准框架中给出的本馆核心元素定义
(1) 版本关于版刻版本影印的说明及相关信息
(2) 物理特征物理外观信息如数量尺寸载体形式装订等
(3) 出版项出版信息包括出版地出版者出版时间等
2. 管理型元数据administrative metadata
用于管理复合对象的元数据其分类借鉴OAIS 的分类机制主要由以下4 方面元素
组成
1 上下文信息context information 指对象内容信息同所在环境的关系包括创建
内容的理由与其它相关资源对象的关系
2 出处信息provenance information 指数字对象的历史包括出处如原始技术
环境变更历史保管历史等
3 验证信息fixity information 提供验证机制
4 评价信息remark/comments 用户对现有元数据的元素项内容进行修改建议或
评述
由于管理型元数据主要与数字对象的类型相关而与具体的资源类型相关性较弱因
此可以根据数字图书馆系统建立情况统一制定适合于同一应用系统中的各种对象类型
详细的内容将在另一篇文章中介绍
3. 应用型元数据application metadata
属于比较特殊的为特定的应用而设立的元数据项
例如为了便于通过地理信息系统来访问那些时空属性很重要的数字对象如拓片
古籍等我们特别设立地理信息系统Geographical Information System 元数据GIS
metadata 项用来描述资源对象的地理时空属性
地理信息元数据包括2 个元素空间项spatial 数字对象所涉及的空间信息时间
项temporal 数字对象所涉及的时间信息
不同于描述型元数据的地方是描述型元数据中的日期时空范围采用自然著录的方
式而地理信息元数据则需经专门加工成特殊格式
地理信息元数据与描述型元数据中的日期时空范围等元素衔接即数据值从这些描
述型元数据的元素值发展出来
五元数据的语义定义规则semantic rules 及语法结构syntax structure
在确定了元数据的结构和元素组成之后需要对制定元数据项定义时应遵循的一般性
规则和具体的定义方法作更为细致的规范称为元数据的语义定义规则
元数据在计算机应用系统中的表示方法和相应的描述规则称为元数据的描述语言和
语法结构
1 元数据语义定义规则
– 各元数据标准应最大可能采用标准框架推荐的元数据项并在语义上保持严格一

– 对推荐的元素不能描述的特性可以增加元素但新增加元素不能与已有元素有任何语
义上的重复并经本框架的维护者确认后加入框架的推荐元素列表
– 为了更为准确地描述对象允许向下再设一层子元素子元素间语义是不重叠的合
起来不能超过元素定义的内涵
– 子元素不可再分
2 元数据定义方法
元数据标准的元素定义方法即元素哪些方面的属性应该被定义采用与Dublin Core
一致的方法即采用ISO/IEC 11179 标准按以下10 个方面定义元素
– 名称Name 元素名称
– 标识Identifier 元素唯一标识
– 版本Version 产生该元素的元数据版本
– 注册机构Registration Authority 注册元素的授权机构
– 语言Language 元素说明语言
– 定义Definition 对元素概念与内涵的说明
– 选项Obligation 说明元素是限定必须使用的还是可选择的必备性
– 数据类型Datatype 元素值中所表现的数据类型
– 最大使用频率Maximum Occurrence 元素的最大使用频次可重复性
– 注释Comment 元素应用注释用于说明子元素情况
子元素也参照这个方法定义并在注释项说明其父元素
3 元数据的描述语言与语法结构syntax structure
由于前面设计原则中所提元数据的互操作性是体现在多个层次上的不仅依赖于元数
据本身对被描述对象的描述方法定义也依赖于异构系统间所交换或操作的数据的具体描
述语言及相关语法因此标准框架对此做了相应规定
– 采用XML 语言及其相关语法结构作为元数据描述的元语言并作为相关应用系统必
备的对外数据接口
– RDF 作为一个资源描述的标准框架能方便地容纳各类元数据标准建立一种复合的
面向异构系统的数据交换格式本标准框架建议各应用系统应支持对RDF 格式数
据的解析
– 元数据的XML 格式语法定义方法采用XML Schema 或DTD
六中文元数据标准制订过程的一些重要问题
前面较为详细地介绍了标准框架的主要内容在将该标准框架应用到中文元
数据标准的制订中还有一些需要特别关注的问题在此提出来供大家参考
著录单位的确定元数据标准的设计要以基本著录单位为基础在设计中文元数据标
准时由于具中国历史文化特点的资源对象情况比较复杂这方面的分析尤其要仔细认真
要与相关专业人员反复斟酌例如古籍其基本著录单位不同于普通图书要表现其不同
抄本同一刻本下的不同印本的特点就必须以每一个单本即复本为著录单位
著录对象关系的分析要认真分析不同对象之间的各类复杂的关联因为这些关系影
响着著录对象的确定进而涉及到元数据标准的设计例如拓片就存在着丛拓和子目
丛刻和子目原刻与摹刻翻刻拓片与影印单张拓片与拓本原刻与附刻碑阳
与碑阴等复杂的关系只有对这些关系进行仔细分析确定是单独还是复合著录才能最
终确定某些元素的设计和拓片元数据标准的内容
个别元素的设计即充分考虑具体类型对象的特殊需求例如拓片在著录时要表现
其中文的书法特点就要设立书法特征元素
拼音问题这是只有中文资源才具备的特点在设计元数据标准时可以考虑在某些元
素下以设立拼音子元素的方式解决
相关规则的建立如著录规则朝代与人名规范档查重标准等的建立这些内容在
很大程度上体现了中文资源的特征虽然对元数据标准的总体结构没有很大的影响但与
某些具体元素的设立却是至关重要的
七中文元数据标准框架的应用实现
1 已有元数据标准
目前北京大学数字图书馆在标准框架下已经设计并应用的元数据标准有
– 拓片元数据标准
– 古籍元数据标准
下表为拓片古籍元数据的描述型元数据部分

此主题相关图片如下:
按此在新窗口浏览图片

正在设计并接近完成的元数据标准有
– 舆图元数据标准
– 学位论文元数据标准
– 网络资源元数据标准
其中拓片古籍舆图三种元数据标准符合本文第一部分所说中文元数据标准的定义
将在标准框架下指导设计完成学位论文和网络资源元数据主要采用国外已有较为成
熟的元数据格式但要和标准框架中的核心元素集建立映射关系
管理型元数据采用同样的结构模型
应用型元数据拓片古籍舆图采用GIS 元数据
2 元数据标准的设计流程
我们各元数据标准的设计均遵循以下工作流程规范包括下列8 个步骤
1) 资源分析
完成对资源对象各方面进行的详细调查分析包括对资源本身的分析调查对资源管
理者使用者的需求调查等
需要强调的是在这里所说的资源对象是一个复合对象即一个抽象的对象集合体
包括原始对象对象复制品数字复制品这些不同的载体形态称为一个对象实例等例
如对拓片对象而言包括原刻拓片本身数字拓片它们都是一些具体的对象实例
可以按 元数据功能一节中提出的几个方面来进行分析
该步骤结束时应完成资源分析报告其内容应包括
– 该资源对象的定义和特点对象间及对象实例间的关系分析
– 著录单位著录范围著录内容项目的确定
– 使用和检索需求即用户希望从哪些方面什么途径去检索第一步最希望获得什么
等这部分内容的搜集分析直接影响检索点的设置和检索结果的反馈
2) 元数据标准的初步设计
提出针对某具体资源对象的元数据标准草案,其出发点包括以下几个方面
– 资源分析报告
– 其它国内外机构对相似资源制定的元数据标准分析
– 标准框架中元数据的结构与元素组成对元数据标准的规范性描述及其已使用
和推荐的元素集
– 标准框架中元数据标准的设计原则
元数据标准草案内容应包括所有元数据项及相关定义一般说来需要慎重设计的
主要是描述型元数据和个别与该类资源联系紧密的管理或其他类型元数据一般通用的管
理型元数据在第一次设计时即已完成
元数据标准草案也可能是等同采用某个其它机构制订的成熟的元数据标准在这
个情况下需要与标准框架中规定的元素集建立映射关系
3) 手工著录检验
组织专业和非专业编目人员进行试验著录以检验元数据标准草案设计的合理与
否该步骤以手工著录方式进行完成后形成手工检验报告
4) 修改元数据标准草案
完成元数据标准草案修订版可能会有多个版本
5) 应用规则建立
在元数据标准草案修订版和资源分析报告基础上提交相应文档形成元
数据应用相关文档汇编作为建立实用系统的依据主要内容包括
– 著录细则
– 检索点索引与查重定义
– 规范档的使用说明
– 元数据和数字对象的权限管理
– 元数据标准的XML 定义
– 元数据标准DTD
– 与标准框架中规定的元素集和其它元数据标准元素集之间的映射表
6) 建立试验著录系统
根据元数据标准草案修订版和元数据应用相关文档汇编建立试验著录系统
和网络试验著录环境
7) 联机试验著录
邀请其他单位的同行参加网络环境下的著录实践以充分收集意见各意见汇总成联
机试验报告该报告应包括3 方面的内容即对元数据本身的意见对相关应用规则的意
见和对系统的意见
8) 元数据标准推荐稿
根据联机试验报告对元数据标准草案修订版元数据应用相关文档汇编
和系统多次修改实践后形成较为正式的元数据标准推荐稿作为正式标准的第一

此主题相关图片如下:
按此在新窗口浏览图片

图3 元数据标准制订工作流程图
3 元数据标准应用的相关规则
在元数据标准在应用过程中尚需根据具体情况提出元数据使用相关的规则
1) 著录规则在不破坏元素语义前提下不同类型的信息资源可以有自己的元数据标准
及相应的著录规则即要给出针对某类信息资源时各元素应著录哪些内容取值范围
数据类型在元素定义中已规定如何处理各类特殊事项有何著录范例等本框架
强调客观著录
2) 是否采用及采用何种规范档常见的包括人名地名如古今地名对照表时代如
中国历史纪年与公元纪年对照表规范档主题词表分类法
3) 检索说明查重标准是否生成拼音检索排序原则索引抽取原则是否是单独的
检索入口是否采用其它相关应用技术如词表技术GIS 技术等
八结语
元数据标准是实现良好的互操作性的基础之一其选择与制订对构建数字图书馆是一
项非常重要而意义深远的工作没有统一的规划和较为全面的考虑将会给以后的工作造
成障碍和浪费
北京大学数字图书馆中文元数据标准框架正是从上述角度出发进行设计和实现的
鉴于国内目前较少有关于研制元数据标准的方法论方面的文章本文希望通过对标准框
架的介绍在中文元数据标准的制定方面与国内同行进行探讨和交流以推动我国元数
据标准的整体化建设为以后各不同数字图书馆系统间资源的交换共享和互操作打下基础
参考文献
1, California Digital Library,  http://www2.cdlib.org
2, Dublin Core Metadata Initiative,  http://dublincore.org/
3, OAI:  http://www.openarchives.org
4, OAIS  http://ssdoo.gsfc.nasa.gov/nost/isoas/overview.html
5, W3C metadata主页 http://www.w3.org/Metadata/
6, W3C RDF XML XML Schema XSL主页均见W3C主页 http://www.w3.org
7, Xiao Long, Chen Ling. Designing and Implementation of Chinese Metadata Standards: A
Case Study on Metadata Applications in Peking University Rare Book Digital Library. Global
Digital Library Development in the New Millennium—Fertile Ground for Distributed Cross-
Disciplinary Collaboration: Proceedings of the 12th International Conference on New
Information Technology. Beijing: Tsinghua University Library, May 29-31, 2001. Beijing:
Tsinghua University Press, 2001.
8, 北京大学数字图书馆研究所主页 http://www.idl.pku.edu.cn
9, 陈昭珍一个XML/Metadata 管理系统设计经验浅谈—Metalogy 之架构与功能简介. 在
中国科学院文献情报中心中华图书资讯学教育学会主办. 海峡两岸第五届图书资讯学
术研讨会论文集2000 年8 月28-30 日成都. 台北中华图书资讯学教育学会2000
年. p. 209-231
10, 刘嘉. 元数据之研究博士论文. 2000 年
11, 吴建中等. DC 元数据. 上海上海科学技术文献出版社2000 年
12, 谢清俊主编. 数位博物馆专案计划技术汇编. 台北国科会企划处1999 年
13, 张晓林. 元数据开发应用的标准化框架. 在中国科学院文献情报中心中华图书资
讯学教育学会主办. 海峡两岸第五届图书资讯学学术研讨会论文集2000 年8 月28-30
日成都. 北京中国科学院文献情报中心2000 年. p. 69-74
14, 陈昭珍主编. 中文诠释资料metadata 格式汇编. 台北国家图书馆2000 年




[] [返回上一页] [打 印]
资讯评论 (评论内容只代表 GISTM 网友观点,与本站立场无关!)

用户名: * 查看 GISTM 更多评论

分 值:100分 85分 70分 55分 40分 25分 10分 0分

内 容:

         ( 注意“*”必填,请自觉遵守法律法规!) 验证码: 验证码,看不清楚?请点击刷新验证码

推荐文章
相关文章

关于本站 - 免责声明 - 帮助(?) - 友情连接 - 网站地图 - 网站留言