都柏林核心元素集

都柏林核心元素集(Dublin Core Element Set,简称DC)

目录

  • 1 什么是都柏林核心元素集
  • 2 DC的产生[1]
  • 3 DC的元素[2]
  • 4 DC的特点[1]
  • 5 DC的限定词[3]
  • 6 参考文献

什么是都柏林核心元素集

  都柏林核心元素(以下简称DC)集是一个致力于规范Web资源体系结构的国际性元数据解决方案,它定义了一个所有Web资源都应遵循的通用的核心标准,其内容较少,也比较通用,因此得到了其他相关标准的广泛支持。面向其他类型资源的元数据标准,基本上都兼容DC标准,并对它作了扩展。它已经成为Internet的正式标准RFC2413和美国国家信息标准Z39.85。

DC的产生

  1995年3月,由OCLC(Online Computer library Center)和NCSA(National Center for Supercomputing Applications,美国国家超级计算应用中心)联合在美国俄亥俄州的都柏林镇召开的第一届元数据研讨会上,产生了一个精简的元数据集——都柏林核心元素集(Dublin Core Element Set),简称DC。围绕如何用一个简单的元数据记录来描述种类繁多的电子信息,使非图书馆专业人员也有能够了解和使用这种著录格式,达到有效地描述和检索网上资源,经过整整七年,OCLC与各有关机构联合举行了8次研讨会。

  第一届元数据研讨会(DC-1)于1995年3月1q日在美国俄亥俄州的都柏林召开,由OCLC/NCSA主持。本次会议的目的在于培养对当前的需求、力量、缺陷以及解决方案的一般性认识以及就建立一个描述网络资源的元数据元素核心集达成共识,目标是定义一个能为全球所理解和接受的最小的元数据元素集;本次研讨会设定了一个包含13个元素的都柏林核心元素集,即都柏林核心(Dublin Core,简称DC),都柏林核心是在网络环境中帮助发现文件类对象所需要的最小元数据集,而对它的结构和句法问题则作为一个执行细节没有进行详细说明,13个文件类对象的信息检索所需要的元数据元素为:主题(Subject)、题名(Title)、作者(Author)、出版者(Publisher)、相关责任者(OtherA—gent)、出版日期(Date)、对象类型(ObjectType)、格式(Form)、标识(Identifier)、关联(Relation)、来源(Source)、语种(Language)、覆盖范围(Coverage)。

  由OCLC/UKOLN(英国图书馆和信息联网办公室)主持的元数据研讨会。1996年4月1—3日,第二届元数据研讨会(DC-2)在英国的渥维克召开。本届研讨会最主要提出了一个建立元数据的容器结构的建议,这种容器结构可以包含都柏林核心以及其他一些不同类型的元数据,都柏林核心的13个元素则没有改变。这次会议所产生的元数据结构之概念基础,被称为渥维克框架,这个框架和元内容框架成为第五届元数据研讨会上所提出的资源描述框架发展的核心。由CNI(网络信息联盟)/OCLC主持的元数据研讨会。1996年9月24—25日,第三届元数据研讨会(DC-3)在美国都柏林召开。会议专门围绕在网络环境中描述图像和图像数据库方面的问题展开了讨论,并最终对都柏林核心的几个元素进行了修改,以使它们不至于太以文本为中心,另外,在原来13个元素的基础上又新增了2个元素:描述(Description)、权限管理(Rights management.)

  由NLA(澳大利亚国家图书馆)/DSTC(分布式系统技术中心)/OCLC主持的元数据研讨会。1997年3月3—5日,第四届元数据研讨会(DC-4)在澳大利亚首都堪培拉召开。会议确定了SCHEME(系统,又称模式)、LANG(语种)和TYPE(属性类型)三种堪培拉修饰词,修饰词的增加使句法问题变得更为复杂,但同时又提出两种嵌入堪培拉修饰词的解决方法:内容超载法和附加特征法。

  第五届都柏林核心元数据研讨会(DC-5)。1997年10月6—8日,第五届元数据会议(DC-5)在芬兰的首都赫尔辛基召开,本次会议由OCLC和芬兰国家图书馆共同组织了这次研讨会,万维网联盟(W3C)元数据工程的代表提交了万维网元数据新规范草案:资源描述框架(RDF),并证明此框架符合在一系列都柏林核心工作会议上提出的基本架构和编码安排,并就有关都柏林核心的15个未限定元素进行了确定,添加额外的子元素并使其正式化,用子结构来支持模式限定词,确立了都柏林核心正式的数据模型

  由LC(美国国会图书馆)/OCLC共同主持的元数据研讨会。1998年11月2—4日,第六届都柏林核心元数据研讨会(DC-6)在美国的华盛顿特区召开。本次会议提出应用RDF数据模型建立都柏林核心数据模型,认为RDF中有足够的完整性来支持都柏林核心建模的目标,并为都柏林核心的应用定义了实施框架。由DDB(德国图书馆)/OCLC主持的元数据研讨会。1999年10月25—27日,第七届元数据会议(DC-7)在德国的法兰克福召开。目的是巩固每个DC工作组的发展、分享应用DC的经验,以及提高DC在不同元数据系统中的互操作性,并于1999年12月22日形成了DC修饰词1.0工作草案(DC修饰词是对15个元素的语义进行限定和修饰的词,修饰词的语义包含于未修饰词中,范围上对未修饰词的语义进行限定,在深度上对未修饰词的语义进行延伸),会议还首次对应用DC进行网络资源揭示的几个项目作了介绍。由NLC(加拿大国家图书馆)主持的元数据研讨会。2000年10月4—6日,第八届元数据会议(DC-8)在加拿大的渥太华召开。会上DCMI(Dublin Core Metadata Initiative,DCMI)负责人Stuart Weibel总结了DCMI在2000年在DC修饰词、DC标准化、DC作为元数据的语法、教育界的DC、DC登记、应用属性等方面工作的进展情况,并对元数据的结构问题(如何利用子结构更好地容纳元数据)、应用属性、都柏林核心注册(开放式元数据注册系统)、特殊领域的元数据(教育界、政府部门、研究界等都柏林核心)作为重点议题进行了研究。

DC的元素

  DC规定了基于web资源15个方面的元素:

  1.Title(标题):资源的名称。

  2.Creator(创建者):资源的创建者。

  3.Subject(主题):资源的主题内容。

  4.Description(描述):资源内容的描述信息。

  5.Publisher(出版者):正式发布资源的实体。

  6.Contributor(贡献人):资源生存期中做出贡献的实体,除制作者/创作者之外的其他撰稿人和贡献者,如插图绘制者、编辑等。

  7.Date(日期):资源生存周期中的一些重大日期。

  8.Type(类型):资源所属的类别,包括种类、体裁、作品级别等描述性术语。

  9.Format(格式):资源的物理或数字表现,可包括媒体类型或资源容量,可用于限定资源显示或操作所需要的软件、硬件或其他设备,容量表示数据所占的空间大小等。

  10.Identifier(标识符):资源的唯一标识,如URI(统一资源标识符)、URL(统一资源定位符)、DoI(数字对象标识符)、ISBN(国际标准书号)、ISSN(国际标准刊号)等。

  11.Language(语言):资源的语言类型。

  12.Source(来源信息):资源的来源。

  13.Relation(关联):与其他资源的索引关系,用标识系统来标引参考的相关资源。

  14.Coverage(覆盖范围):资源应用的范围,包括空间位置(地名或地理坐标)、时代(年代、Et期或日期范围)或权限范围。

  15.Rights(权限):使用资源的权限信息,它包括知识产权著作权和各种拥有权。如果没有此项,则表明放弃上述权力

  通过上述15项可以看出,13(2元数据解决方案比较全面地概括了电子资源的主要特征,涵盖了资源的重要检索点(1、2、3项)、辅助检索点或关联检索点(5、6、10、11、13项),以及有价值的描述性信息(4、7、8、9、12、14、15项);其次,它简洁和规范。这15个元素不仅可以用于电子文档,也适用于各类电子化的公务文档,以及产品商品、藏品目录等,具有很高的实用性。

  DC的限定词主要分为三种类型:语言限定(1ang),模式(scheme),类型(type)。

DC的特点

  (1)简易性

  DC只有15个元素,通俗易懂,如题名项不分正题名、副题名还是并列题名等统称为题名即Title;著者项也没有细分第一责任者、其他责任者等而统一用著者即Creator加以标识,使用起来非常简单。都柏林核心希望能够同时为非编目人员及资源描述专家所用,且多数元素的语义都能被普遍理解,这正适应了数字图书馆信息量迅速膨胀,由专业人员进行著录已是不可能的事实。

  (2)通用性

  不针对某个特定的学科或领域,支持对任何内容的资源进行描述,这个有助于统一其他内容标准并普遍为人们所了解的描述符集合增加了跨学科的语义互操作性的可能。

  (3)可选择性

  著录项目可以简化,只要确保最低限度的7个元素(题名、出版者、形式、类型、标识符、日期和主题)就可以了。

  (4)可重复与可修饰性

  其所有元素都可重复使用,解决了多著者与多出版等重复元素的著录问题,对于需要详细著录的资料,引进了DC修饰词。

  (5)国际通用性

  获得万维网上资源发现界国际范围的认同,对有效的发现架构之发展非常关键。

  (6)灵活的可扩展性

  提供了更加精心制作的描述模型(如MARC编目)以外的经济的选择,既可以嵌入在HTML(RFC2731)中,也可基于XML进行描述,与目前互联网上的相关置标语言标准有很强的亲和性;允许资料以地区性规范出现,并保持元数据的一些特性,从而适应更丰富的资源标准内部的结构和更详细描述的语义编码。

DC的限定词

  基本的都柏林核心集过于简单,但更多的、复杂的应用要求进一步指定元素的语义内容。元素的限定词提供了一种指定语义内容的方法。比如,采用配置限定词可以指定Subject元素的来源或指定一个认证系统(如ISBN或ISSN)。又比如,在Author元素标签中使用类型(type)限定词可以给出作者的姓名、电子邮件地址和电话号码等。目前,限定词指定的方法还需要进一步完善。都柏林核心集的扩展也可以通过对局部元素的使用进行定义的方法实现。局部元素的名字应以“X-”作为开始标识,这样Web搜索引擎能够很容易地识别或忽略局部扩展名。

参考文献

  1. 1.0 1.1 蔡莉静主编.图书馆藏书建设.海洋出版社,2009
  2. 赵泉等编著.高等院校规划教材 信息检索.机械工业出版社,2008
  3. 何斌,张立厚主编.信息管理原理与方法.清华大学出版社,2006
阅读数:342