元数据方案实施意见由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“元数据方案”。
《中国国家试验型数字式图书馆》项目组于4月12日至13日在北京召开了技术组会议,根据会议对元数据 方案所作出的结论,本数字图书馆项目最小元数据集合采用Dublin Core;最小元数据集合Dublin Core的实现采用RDF方式;元数据分成两层,第一层为DC,第二层为MARC或TEI Header,在资源建设中要求按这两层实现。技术组必须据此提出项目所需采用的规范的元数据元素集及其定义、元数据元素的限定规则、以及元数据元素的具 体表达方式。会后提出对各成员馆进行一次调研,对各馆计划进行数字化的资源内容、方式、目前的状态、应用目的等进行 摸底,在5月底以前上海馆仅收到辽宁馆一份,本《实施意见》据辽宁馆和上海馆本馆的资源情况,设想了一般情况,鉴于具体资源情况对元数据方案的实施无重大 影响,本方案据此成文。
DC元数据方案是一个非常灵活且及具扩充性的方案,然而对于各馆合作的同一个项目,原则上应该制订一些 统一规则,例如元数据元素的增删取舍以及限定方式等,当然也可以由各馆自定,这样会在一定程度上影响到互操作性。制订统一规则的难点是必须经过各馆统一一 致的详细讨论,这是一项耗时费力的工作,必须由项目组负责协调组织。
首先必须说明的是,根据项目技术组的结论:
DC只是提供互交换性的中间层,虽然是必需的,但不一定要物理存在,物理层为第二层即MARC或TEI Header,通过自动转换动态获得,或重新抽取均可;
元数据的表达只有在HTML4.0及XML中才能采用RDF方式实现,鉴于目前HTML3.2普遍采用,本项目完成时前者也不一定能完全取代后者,据此本实施意见仍旧考虑了在HTML3.2中利用“META”方式表达元数据元素的方法;
本文涉及许多规则,如DC、RDF等,至今仍然是草案,尚处在不断的变动中,未承诺任何版本兼容性,是否能够得到广泛支持尚不得而知;
本文作为本项目工作小组的研究报告,根据以上会议精神,将对项目元数据方案进行进一步的描述和限定,为便于实际实施,特进行实例描述。
目录
一、DC元素定义及其限定
二、RDF框架及其含义
三、实施实例及说明 DC在HTML2.0/3.2中的应用
DC在HTML4.0中的应用
DC的扩展应用
RDF与DC的应用
四、实施建议
一、DC元素定义及其限定
关于DC的历史影响、结构框架以及为何选用DC作为最小元数据集合的原因本文不再赘述,请参见文末所附的参考资料:
下文给出DC十五个元素的中文基本定义,原文定义请参见其主页: http://purl.org/metadata/dublin_ core。
DC元素基本描述
以下是对DC元数据元素集的参考定义,关于进一步的描述或任何已经定义的限定,请见下列地址: http://purl.org/metadata/dublin_core。在以下的描述中,为便于进行语义上的理解,每个元素都有一个描述性的名称,同时为便于在一定的编码体系中使用,每个元素都有一个正式的标签(Label)。尽管HTML之类的环境并不区分大小写,我们还是建议在实际使用中按照下文所定义的标签大小写来进行书写,以免在转换或移植到其它环境时发生冲突或歧义,如在XML中。(参见 http://中嵌入上述代码特别有用,因为在非缩写格式中,”上海科文工作室”将被作为显示字符析出,而在缩写格式中则无这样的问题。同样例五中的描述可缩写成如下格式: CARD:Name=”John Smith” CARD:Email=”smith@home.net” CARD:Affiliation=”Home, Inc.” />
四、实施建议(未完成)实施建议如下:
首先我们认为在语法结构,使用惯例上没有必要将DC进行中文化处理,而沿用国际通用的英文描述方法。对DC的基本定义也没有必要进行重新修订,以利于信息与国际上的交流。以DC为基本框架
以HTML2.0/3.2格式为主
MARC直接嵌入DC