前言:中文期刊网精心挑选了元数据范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
元数据范文1
关键词:元数据 温州 特色数据库
中图分类号:TP311 文献标识码:A 文章编号:1007-9416(2013)02-0158-01
特色数据库是指充分反映本单位在同行中具有文献和数据资源特色的信息总汇,是图书馆在充分利用自己的馆藏特色基础上建立起来的一种具有本馆特色的可供共享的文献信息资源库[1]。特色数据库建设是数字图书馆资源建设的核心和发展方向。随着信息技术的飞速发展,特别是网络终端的不断普及,数字图书馆及其信息急剧增加。为了适应这种快速发展,信息学家们建立了许多适用于不同资源、面向特定领域的元数据方案,如MARC、DC、VRA等。元数据为数字信息提供了数据内容、语义和服务的机制等方面的精确描述,便于人们标识、发现、评估和管理信息资源。
温州地处浙江东南沿海,是浙南地区的经济、文化、交通中心,拥有丰富的地域文化资源。科技信息化的浪潮,使得温州近几年大力发展、建设了许多温州地域特色数据库。如:《民俗学文献与温州地域特色文化资源数据库》、《雁荡山摩崖石刻》、《泽雅造纸》、《龙湾民俗》、《温州鞋服资讯网》……其中,温州地区共有21所公共图书馆,具有特色库的图书馆比例达到了33.3%;温州地区的高校有19所(不包含独立学院,如温州大学城市学院、瓯江学院、温州医学院仁济学院),具有特色库的图书馆比例达到15.8%。
1 温州地域特色数据库的资源和元数据现状
1.1 资源内容丰富多彩
温州地区各公共图书馆和高校图书馆都从自身服务读者群的角度,结合地域特色收集整理了包括书目数据(OPAC数据)、图书、期刊、报纸、学位论文、曲谱、网址、照片、视频、三维视图等各种题材的地域文化文献,从温州人、温州历史、温州山水、温州宗教、温州民俗等多种角度整理、保存了温州地域文化。集中展示了温州地域特色数据库资源的多媒体特性。
1.2 特色数据库元数据建设
特色数据库的建设标准在高校系统中,经由CALIS、CADAL等项目及子项目的开展,逐渐形成了一套行之有效并有利于长期发展的一套模式及流程。如《CALIS文献资源数字加工与标准》、《描述型元数据及其著录规则》、《CALIS数字对象惟一标志识符命名规范》、OpenURL开放链接标准、LDAP标准、Web Services组件封装规范、Calis United Query and Resultset统一检索接口规范等。其中温州大学的《民俗学文化与温州地域特色文化资源数据库》参照CALIS标准,遵从以上元数据规范原则建设,最终在资源数据量、元数据格式、统一标识、网页层级结构等都有较佳表现。而公共图书馆特色数据库在元数据方面则较为粗糙,这为易获取和数据深层次分析、利用造成障碍。
2 元数据规范设计的原则
元数据可以划分为3种比较宽泛的类型:描述性元数据、结构性元数据、管理性元数据,[2]。描述性元数据指用以描述和识别数字对象的特征、分析信息体知识内容的数据。结构性元数据有时也被称为技术型元数据,是用于确保数字化对象正常发挥功能的技术性信息。它是指相关文件的结构或“标记”,如何组成在一起,如何在各种系统中显示和等。管理型元数据提供有关数字对象的存储条件和转换过程相关的信息。它的目的是满足管理、决策、保管记录的需要,有助于检测、复制和备份数字资源。但是到目前为止,大多数有关元数据的讨论仍只是针对描述性元数据。所以,在描述性元数据规范的制定过程中,需充分考虑著录者、使用者的需求和著录对象的特性,并在其间做一最佳平衡和组配。
一致性原则:指在元数据设计过程中,应尽量注意保持与现有的国家标准、行业标准或者与其他政府标准、国际标准相一致。
简单性与准确性原则:简单性主要指设计的元数据标准在著录实际应用时应较为简单,易于掌握,尤其要考虑到著录人员除编目员外,更多的是相关专业人士,如计算机技术人员在编程时,希望元数据项越简单越好,图情专家则更注重如何细致全面的描述数字对象,因此,同时要考虑到简单化可能导致的不准确,需在二者中作一权衡。
专指度与通用性原则:由于元数据应用的各类资源的各自特性的不同,著录深度(如书目、内容和插图等)和广度(指相关联的一组文献作总体著录)的不同,因此,无法只参照一种元数据标准,需要根据具体的资源实体来确定相应的元数据标准。另一方面,必须考虑元数据标准在一定背景环境下的通用性。
互操作性与易转换性原则:元数据的互操作原则体现在对异构系统间互操作能力的支持,不仅可以为自己的应用系统所操作,而且可以为其他组织或机构的应用系统所操作;不仅可在不同系统实现在同一元数据标准间的数据的传输、交换或转换,而且不同元数据标准间实现数据的传输、交换或转换。通常在元数据的具体应用上,互操作性往往表现为易转换性,即在所携信息损失最小的前提下,可方便地将元数据转换为其他系统常用的元数据标准。要实现这些功能,在元数据标准设计过程中必须慎重考虑元素语义和元素结构的准确定义,其中语义定义尤为重要[3]。
可扩展性原则:由于数字图书馆将要处理的数字资源非常广泛,而各类应用背景更为复杂,当时编制的元数据在该阶段的描述适用于当时的应用背景。经过技术更新及概念的重定义会导致原有元数据的元素或属性值不准确或不足,故应允许使用者在不破坏已规定的标准内容(如元素的语义定义)的条件下,扩充一些元素或属性值。元数据标准中应为这种情况提供指导性原则。
用户需求原则:制定元数据标准的目的是想让用户更好和更充分地理解信息资源,因此用户需求应作为最高的权衡标准。特别是在结构与格式的设计、元数据项的增加与取舍、语义规则的制定等方面,尽可能地从用户的角度出发,增加系统与用户间的交互渠道,为用户提供多层次的检索体系。
参考文献
[1]http:///view/3053788.htm.
元数据范文2
【 关键词 】 数据挖掘;元数据;组预取
Based on Data Mining Exploration Prefetch File Metadata
Tang Yan-qun
( Information Center of Guizhou Economy and Information Technology Commission GuizhouGuiyang 550004)
【 Abstract 】 In the file storage system, improve the overall performance of the file system has to guarantee the reliability and security of documents is important, and in this process, metadata access and file system performance is closely related to performance, in order to further meet the large scale file storage systems need, we must establish the appropriate file metadata prefetching models. Based on the prefetch file-based data mining metadata analysis, in order to meet a lot of access to file data access needs.
【 Keywords 】 data mining; metadata; group prefetching
1 引言
近年来,随着科学技术的不断改革和进步,文件存储系统的性能不断优化,对于满足访问需求起到了较大的帮助作用。但在传统的文件存储系统中,元数据与数据本身是属于同一个文件系统的,在同一个存储设备上保存着,这样,随着访问量的增加,势必会导致文件访问并行性收到影响。对此,通过数据挖掘建立相应的文件元数据预取模型至关重要。
2 元数据访问概述
元数据一词较为常见,通常理解为关于数据的数据,其在数据库管理系统中充分发挥了自身功能,元数据尺寸较小,但其能够存储巨大的数量,对于优化数据库性能具有重要意义。元数据访问中主要包括缓存技术,主要用于降低文件操作率,对于访问过的元数据能够暂时保留,以尽量降低访问延迟时间,但此种技术的应用会受到元数据频繁更新的影响,如果缓存空间较小,更新算法效果较差,从而导致缓存技术的系统性能改善不够显著,最终影响到元数据访问。协作式缓存技术,网络速度的不断提升,使得协作式缓存技术的应用越来越频繁,通过对此种技术的应用,可以充分利用元数据服务系统中的空闲内存,从而形成虚拟的内存空间,以实现对元数据的缓存处理,这样不仅能够减少磁盘操作次数,同时还能够提升元数据访问效率,实现性能改善。
3 元数据访问流程
元数据在文件系统中占据重要地位,能够为文件系统提供整体的、系统的元数据服务,而通过元数据的应用,能够记录各种文件的详细信息,从最初在客户端搜索元数据信息,到最后在协作式缓存中返回,并与本地磁盘相联系,从而实现元数据系统整体性能的提升。
4 数据挖掘概述
数据挖掘主要是指对数据库中的已有数据进行分析,并与现有问题进行对比评估,以解决现有问题。换一种说法,数据挖掘也就是发现数据模式的过程,而这个过程的实现通常是自动化或者半自动化的,最为常见的是半自动化,而通过挖掘得出的规则能够得出经济优势。当前,科学技术的广泛应用对于数据挖掘的研究更加广泛,种类也越来越多,而根据挖掘对象可以分为空间数据、时间序列数据、多媒体数据及文本数据等。
5 基于数据挖掘的文件元数据预取模型
通过成组预取元数据,能够有效降低访问延迟,如果预取组包含了即将被访问的元数据,则能够在一定程度上提升Cache的命中率。在实施数据挖掘之前,应当先将不同的元数据请求联系起来,对应的元数据形成一个模型树,然后对于元数据中的各个文件信息进行序列分组处理,当出现新的元数据请求时,要用其代替原有的旧数据源请求,并由此形成新的模型树,生成新的预取模型。
设文件中的元数据请求序列为ABCDEFABEF,设预测窗口的大小为8,根据本模型需求,不设频率阀值,根据元数据已有的请求需求,将各个节点相连接,形成链表L,每个节点都要包含元数据支持度。根据预测窗口的大小进行序列分组,以8个元数据信息作为1组,当预测窗口形成后要向前移动1个单位,并产生分组。最后对这些元数据信息进行冗余处理,得出分组结果:
组1:AB(CADEFA)经过冗余处理后 AB(CDEF);
组2:BC(ADEFAB)经过冗余处理后 BC(ADEF);
组3:CA(DEFABE)经过冗余处理后 CA(DEFB);
组4:AD(EFABEF)经过冗余处理后 AD(EFB);
组5:DE(FABEF)经过冗余处理后 DE(FAB);
组6:EF(ABEF)经过冗余处理后 EF(AB);
组7:FA(BEF)经过冗余处理后 FA(BE);
组8:AB(EF)经过冗余处理后 AB(EF);
组9:BE(F)经过冗余处理后 BE(F);
组10:EF经过冗余处理后 EF。
通过将上述分组中的子集根据长度进行分类,并依此添加到相关节点中,从而形成相应的访问树。如果是文件元数据A,根据上述得出的元数据请求序列,可以根据相关信息得出具体的访问树。
通过频繁的访问信息筛取,可以从中得出相应的规则,并根据各项规则生成相应的预取组,将其放置在相应的节点上后,能够进行快速预取处理,最终得出相应的元数据信息。通过得出科学合理的元数据信息,能够从文件元数据预取模型中得出更为可靠的数据信息,以满足数据挖掘需求,使得元数据访问性能不断优化。
6 基于数据挖掘的文件元数据预取研究意义
6.1 元数据管理重要性
对于大规模的文件系统来说,元数据的应用至关重要,而加强元数据管理则具有重要意义,通过分析元数据访问过程中的各种预取技术,具有较强的可行性,而且能够进一步改进,从而提升元数据应用可靠性。在本文的研究中,不仅可以利用预取模型进行元数据访问,同时还能够对模型进行综合计算,得出Cache命中率,并得出相应的预测准确度。对于元数据的管理能够减少计算失误,提升元数据访问性能,从而满足存储需求。
6.2 提升系统挖掘效率
对于实际应用中的文件系统,需要充分考虑在线访问的预取情况,针对在线元数据预取情况提出新的计算方法,而新算法的应用充分考虑了挖掘频发闭项的局限性,由此提出了更为有效的数据挖掘方法,从而使得成组预取成为可能。
6.3 改进元数据访问预取挖掘系统
对于元数据访问预取挖掘,主要是根据时间先后进行排序并访问的,这主要是由于元数据访问之间不仅存在时间先后关系,同时还存在物理关系,对于数据挖掘的分析,能够将更加科学、合理的聚类分析方法应用在挖掘过程中,从而得出更为可靠的元数据预取模式。
7 结束语
数据挖掘关乎元数据访问性能,当前在文件信息系统中,由于信息的存储量不断增大,对于元数据访问性能提出了更高的要求,在数据挖掘的环境下,通过建立文件元数据预取模型,分析提出中的元数据访问情况,能够进一步满足信息系统存储需求,并不断由于元数据访问性能,从而更好地满足现代化信息存储发展。
参考文献
[1] 陈莉,焦李成.Internet/Web数据挖掘研究现状及最新进展[J].西安电子科技大学学报,2011(01).
[2] 赵欣,陈道蓄,谢立.并行文件系统PARFSNOW++中的协作式缓冲技术研究[J].计算机科学,2010(04).
[3] 张里.基于数据挖掘的网络入侵检测系统的研究与设计[D].重庆大学,2012.
[4] 韦升华.基于数据挖掘的入侵检测技术应用研究[D].重庆大学,2011.
[5] 张嫣.数据挖掘技术在银行客户关系管理中的研究和应用[D].中南民族大学,2012.
[6] 李建.数据挖掘技术在电信数据分析中的应用研究及原型实现[D].上海交通大学,2010.
[7] 邓承刚.关系数据库对象级别检索结果相关性排序算法研究[D].大连海事大学,2012.
元数据范文3
元数据是关于数据的数据,在建立信息资源目录体系的过程中,元数据主要是对信息资源从外部特征进行而非从内部结构进行描述。通俗地讲,元数据就是信息资源的标签或卡片,通过元数据的描述,可以使信息资源的使用者能够了解数据的内容、特征、作用、获取方式等信息,能够对信息资源是否满足特定的应用需求做出适当的评价,并根据评价的结果决定是否采取进一步的措施来获取该信息资源。
元数据是信息资源目录体系建立的基础,构建一个信息资源目录体系首要和基础性的工作就是建立描述各个信息资源的元数据库,元数据库中存储的是描述各种来源、各种类型的信息资源的描述信息。无论用户以何种方式查询信息资源目录,包括以分类目录的形式进行查询、或者以多关键词的形式进行查询,其本质都是对后台元数据库的检索,只是从表现层提供了不同形式的人机查询接口。根据所描述的信息资源对象的不同,可以建立不同的元数据库,分别对各类信息资源进行描述。
元数据的组成
为能够对信息资源进行准确和高效的描述,元数据本身具有自身的逻辑结构。一般来说,元数据本身是层次化、树状结构的。处于树状结构最底端的叶子节点称之为元数据元素,包含了元数据元素的节点称之为元数据实体,当然元数据实体也可以只包含元数据实体。根据实际需求,元数据实体或者元数据元素可以多次出现。例如,信息资源可以有不同的分类,可以按照信息资源的来源进行分类,也可以按照信息资源的不同应用主题进行分类,因此,“信息资源分类”元数据实体就可以出现多次。
元数据一般分三个方面对信息资源进行描述。
一是对信息资源基本内容的描述。包括信息资源的标题、摘要、关键词等基本信息。标题是信息资源的名称,通过标题使用者能够初步掌握信息资源的基本范围。其次,使用者可以通过摘要,了解信息资源的主要内容、用途等各种信息。一般情况下,用户主要通过摘要作为信息资源适用性评价的主要依据。所以,在信息资源元数据的著录过程中,摘要的填写一般都由专业人员完成,只有专业人员才能够对信息资源的内容有准确的把握和深入的理解,能够提供有关信息资源内容的更加权威的解释。根据信息资源对象的不同,描述信息资源基本内容的元数据实体和元数据元素还可以进行有选择的增加。例如,描述空间信息资源时,可以增加空间参照系、图示表达等元数据实体,描述科学数据资源时需要增加数据质量等元数据实体。
二是对信息资源的获取方式进行描述。包括信息资源的分发者信息、信息资源的在线获取地址信息等。通过提供分发者联系信息,使用者可以直接联系信息资源的分发部门,这对于不能直接在网络上进行数据交换的信息资源获取非常有效。其次,使用者还可以通过信息资源的在线地址来下载、查询、浏览信息资源。使用者甚至可以提供专门的电子订单处理系统,并将入口信息加入到元数据内容中,方便使用者进行在线的信息资源订购。
三是对元数据自身的维护信息进行描述。包括元数据的标识、元数据的维护方、元数据的更新日期、更新频率等。该类信息主要服务于对元数据内容的自身管理,提高元数据的管理和维护效率。在某些特定的条件下,使用者也可以通过元数据的更新日期、更新频率等信息判断元数据与信息资源的一致性程度,进而间接判断信息资源的适用性。
国内对元数据标准的研究
在信息化时代,信息资源的共享和交换需求是普遍存在的。不同的领域,无论这个领域的范围是一个部门,或者是由若干不同的业务部门组成的整体,在建立元数据过程中,从实施的角度,必须确定相应的元数据内容规范。由于共享的程度不同、信息资源内容的不同等因素,各领域制定的元数据标准也有很大的不同。迄今为止,国内外已有若干元数据标准的研究项目和成果。
在国内,许多领域都已开展了元数据标准化工作,其中处于较为领先地位的是地理空间信息领域。从上世纪90年代开始,国家和各相关职能部门就开展了一系列地理空间信息相关的政策、标准和实验系统的研究工作。进入21世纪以来,随着国家电子政务等一批关键信息化项目的启动,地理元数据标准化工作已逐步实现从研究试验向实际应用的转变。
为了促进可持续发展方面的信息共享和交换,科技部“九五”国家重点科技攻关计划项目“中国可持续发展信息共享示范”(97-925)制定了《中国可持续发展信息元数据》。目前,该标准已经应用于中国可持续发展网运行系统中。
科技部“九五”97-759科技攻关项目“国土资源环境和区域经济信息系统及国家空间信息基础设施关键技术研究”,经过研究分析美国FGDC元数据标准、ISO元数据标准等,结合我国实际情况,特别是NREDIS重点数据库群的具体情况,制定出了《NREDIS空间元数据内容标准》。该标准所定义的描述元素覆盖了空间数据集的各个方面,专门针对空间数据集的归档、编目和,适合于空间元数据技术平台对规范空间元数据内容的实际需要。
国家地理空间信息协调委员会组织国家信息中心等单位在《NREDIS空间元数据内容标准》基础上,参考国际标准化组织元数据标准(ISO19115)及美国联邦地理数据委员会元数据标准(FGDC),起草了《国家空间信息基础设施元数据内容标准》。该标准已经应用于国家空间信息交换中心示范网络系统,该系统是一个包括是一个分布式的网络地理空间信息交换系统,所的元数据内容涉及基础测绘、林业、矿产、土地、地质、海洋、遥感、海南省、地区经济等多个方面。
国土资源部与科技司安排了国土资源部“九五”科技项目“GIS支持下的国土资源信息研究――国土资源信息元数据研究项目”。该项目由国土资源部信息中心牵头,组织了国家基础地理信息中心等单位参加,经过详细的调研,参考国际标准化组织元数据标准(ISO19115),制定了《国土资源信息核心元数据标准》,该标准的制定符合中国国土资源管理和信息服务实际需要。
国家地质调查局参考FGDC元数据标准、加拿大地质调查元数据标准、《NREDIS空间元数据内容标准》等多个元数据标准,起草了《地质调查元数据内容与格式标准》,该标准适合对各类地质调查数据化信息资源进行简要描述、数据集与资料编目及信息交换。
为了加强气象资料共享,进一步促进气象资料更好地为经济建设、国防建设、社会发展和人民生活服务,国家气象局在气象信息共享标准化方面也做了大量的工作,气象数据元数据标准就是气象数据共享工作中的重点工作内容之一。国家气象局WDC-D暨“中国地球科学数据中心完善与服务-气象学科部分” 项目参照国际气象组织的统一元数据标准制定了《气象元数据格式标准》,该标准已实际应用与国家气象局的元数据建库和元数据服务系统的建设中。
为促进中国的科学数据共享,科技部非常重视科学数据共享的元数据标准化工作。根据科学数据共享标准化工作的规划,科学数据共享工程开展了元数据相关标准(包括元数据标准化基本原则和方法、元数据内容)的研究。
国外元数据的标准化
各国政府都开始把利用信息技术改进传统管理方式看做是新世纪政府变革的重大机遇和挑战。由于西方发达国家的信息化基础比较好,再加上其政治体制的特点,因此美、欧等国和地区的电子政务起步较早、发展较快。其中较为成熟的是美国政府资源索引服务和英国电子政务元数据标准。
美国政府资源索引服务(GILS,Government Information Locater Service) 是一个辨识描述政府信息资源,提供获得该资源方式的系统。GILS代表“系统”、“元数据”及“服务”等概念。它依据Z39.50建立系统规格书,并设计专属政府信息的元数据栏位,建立一套指引记录(类似编目款目),可在网络环境中检索并取用,且记录中可能包含超链接,指向实际文件,提供公众便利获取政府信息的服务。依照GILS发展指引服务的国家较多,包括美国、加拿大、日本、俄罗斯等国家都相继采用它作为政府相关资讯的元数据格式。这不仅提高了政府资讯传播的效率,人民对于政府也增强了了解,而且对于未来各国政府政务信息的交换与共享也提供了方便。
英国电子政务元数据标准(E-GMS ,e-Government Metadata Standard)标准制定了元素、元素精炼、编码规则,以供政府人员为他们的信息资源创建元数据或设计检索系统时使用。E-GMS的第一个版本是由简单的都柏林核心(DC)元素构成。E-GMS在修订时已近可能吸纳DC的元素、元素精炼和编码规则。它定义了政府公共部门电子政务元数据的结构和规则,政府部门在创建其信息资源的元数据或设计信息系统的检索系统时都要遵循该标准。E-GMS用于实现数据的互操作,便于公众找到所需要的政府信息和服务,而无须了解政府部门的组织结构和职能配置。
元数据的互操作与交换
按照不同元数据标准而采集和建立的元数据库,在更大范围内的信息资源开发和利用过程中遇到了元数据内容的互操作问题。互操作的本质问题实际是语义问题,不同领域的元数据标准的制定都带有本领域对特定概念的理解和认识,表现在元数据标准上的是元数据实体和元数据元素的“同名异意”以及“异名同意”问题。要解决元数据标准互操作问题,首先,需要明确各标准中元数据实体以及元数据元素的含义; 其次,根据确定的含义建立不同元数据标准的元数据实体和元数据元素映射关系; 最后,在信息系统实现层面,由软件实现对不同元数据标准的翻译,对于某些需要整合已有不同标准元数据库到统一元数据库的情形,可以由软件系统进行统一的数据转换处理。
元数据库建立后,不可避免要产生元数据导入、导出、元数据交换等需求,在该项活动中,首先需要确定是元数据的格式和编码。不同的系统可能产生不同的元数据记录的转换格式。目前,采用XML作为元数据转换格式逐渐成为异构元数据库(系统)间元数据交换的主要形式。
背景资料
为什么要提出信息资源目录?
人类经济社会发展历经农业社会和工业社会,目前,正加速向信息化社会发展。信息化社会是人类经济社会发展所必经的一个崭新阶段。在此阶段,以信息技术为支撑,以信息资源的开发和利用为核心,全面整合人类的各项生活和生产活动,推进人类文明向前迈出一大步。
信息资源是信息化社会的基础和核心,是重要的生产要素和无形资产。信息资源的内容涉及到人类活动的各个领域和各个层次。在领域上,信息资源的内容包括了科学、教育、文化、卫生、军事、经济等各个方面; 在层次上,信息资源的内容包括了反映国家和地区整体活动特征的宏观社会经济活动信息,以及表征微观世界的物质组成信息等。从信息资源的表达形式上,包括了文本、数字、图像、音频、视频等。
目前,随着信息采集手段的增强以及信息利用层次的提高,整个社会的信息资源的数量正处于加速度的状态。例如: 围绕人自身的各种活动,需要各种类型的信息进行支撑,包括人员的基本信息、教育信息、就业信息、医疗信息等,这些散落在各行业、各部门的信息以每个人1MB的数据量进行计算(不计算涉及到个人的多媒体信息),仅中国13亿人口的信息将达到1300TB。再以对人类居住的地球的自然环境特征的了解为例,通过向太空发射卫星,在地面设置各种监测站(点),已经形成了超海量数据的获取能力。在太空,各种类型的卫星,包括气象卫星、军事卫星等已经形成了PB级信息,并且随着新的卫星的发展和卫星影像分辨率的提高,积累的数据量将形成滚雪球的效应。在地面,人类设置了监测水文、地震等各种类型的,数以万计的不同类型的监测点,近乎实时的进行各种信息的采集。
不断增长的信息资源数量向信息资源的深度开发和利用提出了新的课题。人类社会区别与其他动物的显著特点是社会化的分工合作,通过社会分工和专业化的发展,极大地提高了生产效率,同时社会化分工也需要各层次、各行业、各部门进行紧密沟通和协作。社会化分工越细、层次越多,用于沟通和连接的信息量越大,信息沟通的频率也将加快。尤其在信息化社会,当信息资源作为生产要素参与整个人类的经济社会活动时,信息资源的共享和交换越来越成为迫切需要解决的问题,通过信息资源的跨行业、跨部门的共享以及信息资源的有序交换,可以增强社会生活各环节之间的联系。同时,由于信息资源的可重复可拷贝特性,当信息资源实现共享和交换后,信息资源的价值将出现倍增效应。因此,信息资源的共享和交换必将极大地推动社会经济的发展。
元数据范文4
【摘 要 题】信息资源建设与管理
元数据是“关于数据的数据”或“关于数据的结构化数据”,现在常说的元数据,是特指在标记语言(SGML、HTML、XML)环境下,对网络信息资源进行描述的解决方案,主要是用于网络信息资源的发现、存储、管理和检索利用。在当前网络信息呈异常迅猛发展之势,大量的多样性的数字化资源,使得信息的利用和查找十分困难。为了解决这一问题,在国外已有了很多的元数据研究项目和成果,建立和运行了一些描述网络信息资源的元数据模式。元数据的应用,为网络信息资源的有序组织、适度控制和高效检索利用,提供了便利的条件。近年来,中文网络信息资源也在迅速增长,尽快研究和制定中文核心元数据标准,已是非常迫切的了。在制定中文元数据标准时,既要考虑到中文元数据处理的特殊性和中文资源的应用特点,更要从全球的信息大环境出发,分析、研究和借鉴国际上先进的、通用的元数据标准,在尽量保持与国际标准接轨的基础上,制定符合中文资源应用需要的扩展与应用规范。
1 中文元数据标准应以DC为基本框架
在国际上众多的元数据方案中,Dublin Core Element Set(都柏林核心元素集,简称DC),以其结构简单、语意互通和可扩展等特性,事实上已成为国际范围内通用的网络信息资源描述的元数据标准。DC经过几次国际会议的研讨和修订,已逐步完善和成熟。所以,制定中文元数据标准应以DC元数据为基本框架。国内在四五年前就已开始了对DC的探讨和研究,但至今尚未完全形成依托中文环境的DC元数据标准。当前应进一步加紧深入地对其进行研究和规范,形成中文元数据的一个标准核心集,以适应中文网络信息资源的发展。中文元数据标准应完全按照DC元数据集来建立,在具体作法上要注意以下一些问题。
(1)完全按照DC元数据的框架结构来制定中文元数据标准。由于网络信息资源在时空上的广泛性和开放性,与传统的文献著录的相对封闭性有着很大的不同,因此,中文元数据标准的制定,应强调与国际接轨,保持完整的一致性。也就是说要完全遵循DC元数据的框架结构来构建中文元数据标准,而不应该提出“以DC为主,参考其它元数据标准”来搞中文元数据标准。我们应汲取CNMARC的教训,避免把中文元数据标准搞成“CNDC”。中文元数据标准应该只是对DC元数据进行本地化和中文化的处理,对它的内涵、外延等用中文予以标准地诠释,方便使用中文的著录者和检索者理解与利用,仅对于著录和检索中文信息资源的一些特殊性和应用特点等有限的方面进行规范的规定和定义。
(2)中文元数据标准的制定,应完全保留DC元数据的基本特点。一般地讲,内在性、可扩展性、独立句法结构、可选择性、可重复性和可修饰性是DC的6大特点,在实践中集中地表现为DC元数据的简易性、通用性、兼容性以及灵活的可扩展性,这些特性是DC能够成为一个国际上通行的元数据标准的原因,也是建议中文元数据标准应完全按DC来制定的理由。因此,在制定中文元数据标准时,要完全保留DC的基本特点,不应有任何的更改。在国内有些使用DC元数据时,将某些元素规定为“不可重复”或“必备”等等,这种做法是不可取的。
(3)应以国际通行的DC修饰限定词作为中文元数据的规范和扩展的依据,而不应采用其它形式。DC修饰词提供了对元数据的扩展描述,可以缩小元素的含义范围,使其更具有专指性,或是对元素进行规范性说明。目前,DC已正式确定了三类修饰:模式体系、语言种类和类型。如为了表达不同的日期,在使用“Data(日期)”这一元素时,可以增添“Created(创建)”、“Valid(有效)”、“Issued(发行)”、“Modified(修改)”等修饰词。在中文元数据标准中,不应把这些元素的修饰词解释为子元素。元素与加了修饰词的元素没有主次之分,修饰词并不改变元素本身的定义。元数据标准中,不应出现子元素的提法。元素的修饰限定和规范,是元数据元素的内在特性,是元素的不同表现形式,绝不能把元素和加了修饰词的元素看作是元素与子元素的关系,应坚决防止中文元数据标准的MARC化倾向(在MARC中就有的字段、子字段之分)。元素与加了修饰词的元素或多个附加了修饰词的元素同时出现,是元数据的元素可重复性的体现。转贴于
2 中文元数据标准应形成一个完整的体系
中文元数据标准是整个网络上中文信息资源及中文电子出版物等的著录和检索的工具,其应用范围是很广泛的。因此,制定中文元数据标准的同时,还应对所涉及的相关的标准、规则和条例等进行研究、修改和制定,并逐步完善其推广应用机制,使中文元数据标准逐步形成一个完整的体系,更好地服务于日益发展的中文网络信息资源的开发和应用。与中文元数据标准相配套使用的一系列标准、规则和条例等的制定、修订,要本着易用性、通用性、国际性和规范化、标准化、自动化的原则进行。这方面的工作主要的有以下一些:
(1)修订和完善各类中文信息的代码体系,并尽量与国际通用的代码一致起来。制定有关中文的“资源类型表”、“格式类型表”、“关联值列表”等,以规范中文信息资源的著录和检索利用。
(2)制定有关中文关键词选词截词等规则,以适应中文信息资源的自动化著录和检索。制定中文网页及电子出版物、数据库等的制作规范和条例。
(3)编制一个简单易用,能够适应数字化信息著录和检索的“中文信息资源树形分类表”。目前图书馆界广泛应用的《中图法》,其分类体系和类目设置均无法适应网络时代信息分类的要求。
(4)建立一个像OCLC的CORC项目那样的中文元数据在线编目系统,免费提供中文网页或电子出版物的元数据自动生成。还应建立CNMARC与中文元数据的映射表,提供CNMARC数据向中文元数据格式的转换等服务。
(5)仿照印刷文献的在版编目(CIP)规定,制定中文网页和电子出版物的在版元数据著录规定,以行政手段强制要求所有正式注册的中文网页及电子出版物等,必须具备元数据著录项目,实现中文网络信息资源的作者著录,使中文元数据能够较快地在大范围内推广,方便中文资源的高效利用。
元数据范文5
关键词:地理信息元数据 元数据的设计 管理模式
中图分类号:P2 文献标识码:A 文章编号:1672-3791(2013)04(a)-0064-02
随着“数字地球”,“数字中国”的付诸实施,空间信息飞速扩长,如何有效管理、使用、共享这些异构、多源、海量数据的问题日益突出,地理信息元数据以其描述性、开放性、简易性而逐渐得到认可[1]。元数据是关于数据与信息资源的数据,即关于数据与数据集的内容、质量、状况和其它特性信息,是实现数据高效组织、管理、维护、快速检索、访问、存取的核心和关键技术之一[2]。地理信息元数据是关于地理相关数据和信息资源的描述信息。地理信息数据内容繁杂且数据量庞大,建立地理信息元数据是对其进行管理及共享的有效可行方法[3]。它通过对地理空间数据的内容、质量、数据格式、数据采集时间和其他特征进行描述与说明,帮助人们有效地定位、评价、获取和使用地理相关数据[4]。
1 地理信息元数据确定的原则
建立元数据集合,是帮助人们理解和使用元数据所描述的数据对象,以实现空间数据的标准化为目的,以实现数据的共享为前提[5]。元数据的选择和组织必须遵循一定的规则,以全面描述数据对象,并方便用户使用。地理信息元数据的确定需要遵循以下的原则。
1.1 完整性
元数据设计中需要挑选出一些最重要的元数据,构成核心元数据集。核心元数据是有效描述数据特征的最小元数据数据集合,它应该完整地描述数据集最重要的信息。
1.2 准确性
各个元数据元素应该从某个侧面准确地描述数据集合的某些特征。在确定核心元数据内容的时候,需要对相关领域的理论与技术有全面的了解,准确而简洁地将描述数据集主要特征的数据元素整合起来。
1.3 结构性
地理信息元数据之间具有复杂的联系,应根据实际其结构联系进行合理组织,以便对元数据进行修改或扩展时不破坏其整体结构。
1.4 与其它标准的一致性
由于元数据也是其他标准的高度概括,在制定元数据时,应调研相关领域现有的国家标准与国家、行业准则,尽量采用已颁布的标准。
2 地理信息元数据的主要内容
目前,地理信息元数据还没有一个统一的全球性标准。通常采用以下几方面的内容。
(1)标识信息。它是唯一标识数据集的元数据信息。通过标识信息,用户可以对已有的数据集有一个总体的了解,如数据集的名称、时间、版本、空间范围、表示方式、空间分辨率、信息类别、数据集的联系信息、数据集法律和安全限制等。
(2)数据质量信息。它数据集质量的总体评价,包括数据集在数据完整性、逻辑一致性、位置精度,时间精度(时间表示的精确程度、现势性、有效性)、属性精度(数据集属性分类的正确性、属性值的精度和正确性)等方面的综述以及说明数据质量的保证措施,以及数据源、数据处理过程、数据志等说明信息。
(3)空间参照系统信息。它是对数据集使用的空间参照系统的说明。
(4)内容信息,描述数据集的主要内容,包括实体和属性信息。
(5)分发信息,描述有关数据分发者的信息及获取数据的方法。
(6)核心元数据参考信息。包括核心元数据参考信息,用户可以了解到核心元数据内容的现势性等。
3 地理信息元数据的设计
元数据设计过程中,通常根据实际应用的需要,参照已有元数据标准确定元数据体系。近年来,西安市城市建设快速发展,地理信息元数据是空间数据交换的基础,也是空间数据标准化与规范化的保证。西安市勘察测绘院为了提高生产管理质量,更好的满足城市发展的需要,在地形图的生产中也加强了在元数据方面的管理。下面以我院生产为例,简要说明地理信息元数据的设计。
(1)元数据标准主体组成,如表1所示。
(2)元数据结构。以目前我院地形图数据的生产管理为例,地形图元数据结构,如图1所示。
(3)元数据的录入。以我院地形图数据信息录入为例,如图2所示。
(4)元数据的更新和维护。元数据随地图数据的变化而变化,元数据的更新管理主要通过版本管理来实现,这样数据管理者可对历史数据及最新数据进行全面的管理。
(5)元数据的质量保证。元数据的数据质量是数据质量的一个部分,也是数据质量的基础。在元数据库建立、更新、维护的全过程中,必须保证元数据质量。扩展的标准要进行一致性测试,元数据操作工具应具备保证质量功能,有条件的应进行质量评价[6]。
4 地理信息元数据的组织与管理模式
4.1 元数据的逻辑组织可采用如下方式
(1)按照元素性质来组织。这是通常的元数据组织方式。由唯一标识一个数据集、说明其空间和时间范围、状况、法律限制和保密限定所需的信息的元素构成标识信息子集等。
(2)按照功能来组织。主要方法是将元数据分成描述性元数据、结构性元数据、功能性元数据三类,分类进行组织。
(3)按照重要程度来组织。按照元素使用的频繁程度或者重要性差异,将元素分成核心元素和一般性元素,其中核心元素是所有类型的数据所共有的。如英国Dublin元数据核心元素模型和澳大利亚、新西兰元数据核心元素模型都是如此[7]。在区分核心元素与一般元素的基础上,又对核心元素按照不同的侧面进行分类。
4.2 元数据的管理模式
空间数据飞速增长,我们通过建立若干分布的、相对独立的元数据仓储,它们分别对应于不同的部门或地区,然后通过元数据交换标准实现信息共享和分布异构系统的集成[8]。从业务需求来看,元数据管理系统用于存储、管理和共享各种元数据,一个良好的系统应具备集成性、可扩展性、可制定性和开放性等基本特征[9]。鉴于MOF和XMI的特点和发展经验,我们基于MOF和XMI设计了空间元数据的管理模式,如图3所示。
5 结语
随着计算机技术和GIS技术的发展,已经积累了大量的地理信息数据,要实现数据的管理和共享就必须依赖于空间数据和属性数据以外的一种特殊数据。地理信息元数据能够帮助生产单位有效的维护和管理数据,提供有关数据生产单位的各种有关信息,供用户查询,帮助用户了解数据,提供有关信息,以便用户处理和转换有用数据,采用元数据也可以便于数据的共享。我们在生产管理中,应根据相应的规范,并且结合自身的生产需求做好元数据的录入,管理工作。通过我院元数据在基础地理信息系统中的建立与运行,说明元数据的功能是稳定的,应用起来也比较方便,能够在城市基础地理信息系统中发挥重要的作用。我们将进一步改进与完善工作细节,开发研究元数据扩展的必要性和扩展的基本方法,更好的提高工作效率,使地理信息元数据在地理信息领域的应用中拥有更为广阔的前景[10]。
参考文献
[1] 周新忠,余木良,陶亮,等.关于地理空间元数据技术发展趋势的理论探讨[J].测绘科学,2007(2):172-175.
[2] 赵汗青,郭刚.地理空间信息元数据模型[J].测绘通报,2002(z1):19-23.
[3] 滕连泽,刘洪斌,武伟,等.地理空间元数据管理的研究[J].农业网络信息,2005(8):39-41.
[4] 沈体雁,程承旗.地理元数据技术系统的设计与实现[J].武汉测绘科技大学学报,1999(4):326-330.
[5] 牛晓琳,季民,赵志刚,等.基于元数据管理的数据共享研究[J].船舶电子工程,2006(1):71-74.
[6] 祝方雄.城市地理信息系统中元数据标准的研究[J].城市勘测,2001(3):37-41.
[7] 罗英伟,邢彭龄.基于XML的地理信息元数据系统[J].计算机学报,2005(7):1205-1212.
[8] 王继周,李成名,林宗坚,等.面向共享的空间元数据管理框架研究与设计[J].国土资源遥感,2003(3):67-70.
元数据范文6
摘 要:当前基于联邦数据库方向的多媒体联邦数据库系统已经取得较大发展。然而.在大多数项目研究中,很少有项目将重点放在元模型的研究上。反过来说,标准数据库系统(关系,对象关系.面向对象)没有定义了一种多媒体和联邦特点的元数据模型。在这篇文章中,提出了一种多媒体联邦数据库的元数据结构的规范。这种规范的结构是基于一种新的面向对象的元模型.而这种元模型是支持多媒体类型和联邦元数据的。通过使用这种元模型,联邦多媒体的管理者和用户能够准确的确定出数据是如何构成的,以及操作类型是如何允许实现的。
关键词:联邦数据库:元数据:多媒体
中图分类号:TP311 文献标识码:A 文章编号:1009―3044(2007)01―10035-03
1 引言
许多应用需要存取未名结构的数据库,初始目标是确定数据库的实体以及他们之前存取或修改数据的关系。在这种联邦数据库的领域中,作为全局管理者或工程师经常需要使用各种不同类型的软件系统,构成一种或多种全局模式。这种数据库存取的类属性形式相当于是一种映射,这种映射表明了动态结构和调用请求的可能性。
EGTV(基于视频媒体的全局有效事务)的目标是通过普通的元模型界面将媒体集合成大量多媒体数据库系统。这项研究的贡献在于为联邦多媒体提供了一种元模型的规范,这种规范的执行不仅被映射到对象数据库管理组(ODMG),而且还被映射到对象关系的元数据模型中。此外,这种规范的重点在于如何采用元数据来集成大型多媒体系统。
在EGTV项目中,可以通过分布结构的形式为多媒体提供一种高效的数据存储系统。但是它无法采取一种简单的集中化数据存储形式。因此EGTV项目的一种解决方案是使用标准的面向对象和对象关系的联邦数据库来存储大容量的多媒体数据。使用联邦结构的好处是能够集成大量的可以横跨多个数据库的多媒体,以及可以通过创建本地存储多媒体数据的对象视图来定义全局模式。通过分散地数据库站点来增加系统的整体存储容量。这种联邦结构能够定义私有多媒体数据库,这种数据库能够在将来被应用为全局模式。而这种联邦的好处是,通过单一的联邦模式,许多用户能够浏览大量的多媒体数据。
2 EGTV系统结构
在本节中提出了一种系统结构,这种系统结构是在联邦数据库中通过各种不同的多媒体数据源来构成一种全局模式。它依据联邦数据库系统的标准结构,通过一些必须的修改来进行多媒体数据的处理。
如图1所示的结构可以分为五层,每一层都可以以数据库模式被定义。这种模式可以通过层与层之间的处理器来创建与操作。通过以下几个方面,我们可以看出这种结构与普通的五层结构是不相同的。首先,多媒体数据存储在数据库层;其次,EGTV元模型定义了一种规范模式,并且通过使用两个不同的处理器(查询处理器和转换处理器)与数据库层进行相互作用;最后,表面层将通过CORBA和XML的界面形式给客户机提供联邦模式人口。
数据库层:在这一层,联邦结构系统的所有数据都存储在ODMG数据库或对象关系数据库中。数据库作为数据和多媒体对象的物理存储器来使用,但是它也可以以封装的形式来存储私有多媒体数据。
规范层:规范层通常来说包含数据和元数据两部分。规范模式将会在EGTV元模型中体现。这一层定义了数据库模式,也可作为局部数据存取的入口。从图1的结构图中,可以看出用户通过查询处理器或转换处理器在数据库层与规范层之间进行数据存取。
视图层:视图模式是规范模式的子集,并被共享在其他数据库之内。它以对象视图的形式来表述。
联邦层:多种视网模式通过综合处理器可以综合成联邦模式。在EGTV模式下,联邦层存储的模式为联邦元数据形式,它可为全局查询提供一个存取点。
表面层:表面层的作用是转换联邦模式以及为客户机存取提供可相配的子系统。从图1中可以看出,表面层通过XML和CORBA两种界面可与联邦数据库进行数据存取。
转换处理器:转换处理器将本地数据库的数据和元数据转换成标准的联邦类型。
查询处理器:查询处理器通过规范层模式将被提交的查询转换到本地数据库。在EGTV模式下得到的查询结果将以编码的形式返回到规范层。
过滤处理器:过滤处理器可以通过过滤和调整存储在规范层中的元数据创建视图子模式。
综合处理器:综合处理器可创建一种连接,它可将多重视图模式与联邦模式相连接。
CORBA界面:联邦系统的客户机可以使用CORBA界面对联邦模式的数据存取进行程序设计。
XML界面:XML界面为联邦模式下的数据存取提供了一个通用的查询方式。
3 EGTV元模型规范
3.1定义命名范围
每一个数据库实体都必须在它作用范围内拥有一个唯一的名称。例如:在数据库模式中,类名称是唯一的,因此其属性名称也是唯一的。因为每一个元类都为其包含的元素提供了命名范围.所以元模型中的命名范围和包含关系是紧密联系的。如图2所示.在元类与元类之问,元模型定义了一个单一的包含,范围的关系。
在图2中,sys_MetaObject是为元模型所有要素一个抽象描述,它定义了几个通用属性:name、meta Type、virtualLevel、com―ment。元模型sys MetaObject派生了sys_Property、sys_Parameter、sys_lnheritance三个元类,其他的元类(sys_Type、sys_Operation、sys-schema)则是由元类sys_ScopedO biect派生出来的,而元类sys_ScopedObject又是由元模型sys_MetaObject派生出来的。
3.2定义类型
在数据库中所定义的类型必须以从元类sys―ScopedObiect派生出的元类的类型作为依据。如图3所示,所有的数据类型将在元数据类层所体现。元类sys_Type是数据库中所有类型的一个抽象描述,从它可以派生特殊的元类。我们的元模型通过允许可以使元类sys_Type更快地操作,然而ODMG元模型只允许用户通过定义类来完成操作。
元类sys Tvpe作为系统和用户定义类型的规范。我们使用系统类型去定义类属性的类型或操作参数的类型,但是不能用系统类型去定义自含数据库对象。
3.3定义属性
从图1中可看出.元类svs_Property是从元模型sys_MetaOb-iect中直接派生出来的。而在图4中可以看出,类的成员是由元类sys Attribute所指定的,它的每一个属性都可以通过使用isStatic特性和isConstant特性被定义成Static和constant。我们可以用系 统类型或类类型去定义属性,每一个属性都只有一种类型,但是同样一种类型可以用于多个属性。从图4中,可以看出,at-tribute_type是元类sys_Attribute和元类sys_Type两者之间的关系,而元类sys Type其实是真个元模型中所有类型的一个超类。
3.4定义继承
继承是面向对象程序设计的一个重要特征,它通过继承原有类派生出子类,进而构造出更为复杂的数据类型。利用继承,可以来创建一个具有公共属性的类,然后根据需要创建具有特有属性的新类以适用于不同的情况。继承是在原有父类基础上添加程序代码建立新类,而这个新类既能运行自己定义的方法.也可以运行父类中定义的方法,从而达到代码复用的目的。如图5所示.参数positionNumber就是一个基类的多重继承定义。
3.5定义操作
我们可以用系统类型和类去定义操作。指定操作的系统类型是类型定义的一部分,但是不能被用户修改。元类sys_Operation是数据库中所定义的所有操作的抽象描述,它是从元类sys_ScopedObject中派生出来的。如图6所示,可以采用opera-torKind特性将操作符定义为一元操作符和二元操作符.若给方法增加static或virtual修饰符,sys_Method的特性methodKind就可以被指定。
3.6定义模式
模式可以作为类和对象视图的顶层容器。基于类和视图的对象能够在数据库模式下被记录。从图1可以看出,元类sys_Schema是从元类sys_SeopedObject派生出来的,而从图7中可以看出,元类sys_Schema又派生了两个元类:sys_Databas.eSchema和sys_SubSchema
3.7定义视图
sys_SubSchema是一种特殊的“模式”,它的作用是提出对象视图。它包含基类和虚类,每一个子模式都隶属于数据库模式。视图在子模式下提出的是可行的,但是在仅仅在虚类下提出是不行。对象视图为面向对象数据库模型重载了模式功能,这样就可以适用于不同的联邦模式数据库。
3.8元一元数据层
在某些抽象层内,每一个元数据模型都可以描述数据库模式的结构。我们的元数据模型可以专门用来支持多媒体元数据。在图8中给出了元一元数据模型的规范,我们可以看出元一元数据模型对整个系统是非常有益的,因为它允许我们指定一个新的元模型,还可以在已有的基础上增加新的元类。
4 元模型的映射
EGTV元模型的规范的执行不仅被映射到对象数据库管理组(ODMG),而且还被映射到对象关系的元数据模型中。由于有部分EGTV元模型功能没被映射到ODMG和对象关系规范中.因此映射并不包含全部EGTV元模型功能.例如定义多媒体类型和创建对象视图。ODMG和对象关系元模型必须具有扩展性,可以随时支持新的EGTV元模型功能。
4.1 EGTV到ODMG的映射
EGTV元模型是基于ODMG元模型规范的,因此两种元模型可以共享相似的面向对象平台。对于两种元模型的相似定义的元类,映射的实现是相对简单的,但是对于多媒体类型或对于对象视图来说,映射的实现是比较复杂的。这一节主要解释了映射的规则,在表1中给出了EGTV主要的元类以及它们对于ODMG元模型的映射。
4.1.1模式映射
元类sys_Database模式定义了数据库模式属性,包括为所有模式要素定义的根命名范围。它被映射到元类d_Module中,这样在ODMG元模型中就会产生一个等效的类。由于每一个数据库模式都在sys_DatabaseSchema中被指定。因此通过映射就会在ODMG元模型中创建一个d_Module实例。在例1中就说明了这种模式映射。
例1:ODMG模式映射
Map sys_DatabaseSchema:=d_Module,d_Extension
{attribute:
isFederated:=d_Extension.isFederated
databaseTvpe:=d Extension.databaseType
relationship:
containedIn:=d_Module.definedIn
containedObjects:=d_Module.defines}
4.1.2类映射
两种元模型都通过单一的元类表示了数据库类。在例2中就说明了这种类的映射。
例2:ODMG类映射
Map sys_CLASS:=d_Class,d_Extension
{attribute:
isAbstract:=d_Extension.isAbstract
relationship:
containedln:=d―Class.definedIn
containedObiects:=d Class.defines
inheritsTo:=d Class.inherits
derivesFrom:=d Class.derives}
4.1.3属性映射
EGTV的类sys_Attribute定义的每一种属性都映射到了ODMG元类d_Attribute中。sys_Attribute中的所有属性和关系都被映射到相应的d_Attribute的属性和关系中。
4.1.4继承映射
继承映射是从元类sys_Inheritance映射到ODMG所定义的类d_Inheritance中。所有的元类sys_Inheritance的属性都被映射到类d Inheritance中。
4.1.5关系映射
EGTV中的元类sys_Relationship将映射到ODMG的元类d_Relationship中。在例3中就说明了这种类的映射。
例3:ODMG关系映射
Map sys_Relationship:=d_Relationship,d_Extension{attribute:
cardinality:=d_Relationship.cardinality
accessKind:=d_Relationship.accessKind
isUnique:=d_Extension.isUnique
isOrdered:=d_Extension.isOrdered
relationship:
containedln:=d_Relationship.definedln
traversal:=d_Relationship.traversalI
4.1.6数据类型映射
在EGTV模型和ODMG模型中原始的数据类型和集合数据类型以相同的方式被实现。在表2中可以看出。sys PrimitiveTvD£被映射到d_Primitiverrype中,而sys_CollectionType则被映射到d_Collection_Type中。在EGTV元模型中定义了多媒体类型,但在ODMG中却没有与此相对应的类型。此外.多媒体类型能够定义一种行为方式,这种行为方式是不支持ODMG元模型类型的。
4.1.7对象视图映射
对象视图包含一个或多个虚拟类,它可以被当前工作的视网子模式所表示。EGTV元模型是支持对象视图和虚拟类的.但ODMG元模型是不支持对象视图的,所以ODMG只能通过扩展本身才能支持对象视图的映射。由于篇幅限制,这里就不讨论对象视图的映射规则。
4.2 EGTV到对象关系的映射
由于对象关系数据库还未拥有一个标准的元模型,因此在这篇文章中,我们采用OracLe元模型作为我们的元模型。对象关系模式可以通过一系列的关系表存储关系和对象关系元数据。EGTV元类与Oracle模型仓库的映射如表3所示。
5 结束语