文档库 最新最全的文档下载
当前位置:文档库 › 电子文件元数据标准

电子文件元数据标准

电子文件元数据标准
电子文件元数据标准

电子文件元数据标准

(征求意见稿)

1.范围

本标准适用于各级机关、团体、企事业单位、社会组织。本标准规定了电子文件元数据的结构、定义、编码体系。

本标准描述的数字对象为通用的电子文件核心元数据,主要为原生电子文件与数字化文件(文本、图像)元数据。根据发展需要,扩展编制图形、影像、声音等文件类型的元数据标准。

2.编制目的

2.1 对文件及相关实体进行标准化描述;

2.2 实现不同机构、不同系统之间文件及信息的互操作;

2.3 为电子文件在不同时间、不同空间、不同应用软件中的再利用提供统一的元数据;

2.4 为电子政务、办公自动化、电子文件中心、文档管理、档案管理等系统提供成熟的电子文件全过程管理的设计模式。

3.规范性引用文件

下列文件中的条款,通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。

GB/T 2659-2000 世界各国和地区名称代码

GB/T 2260-2002 中华人民共和国行政区划代码

GB/T 11714-1997 全国组织机构代码编制规则

GB/T 9704-1999 国家行政机关代码编制规则

GB 2312-1980 信息交换用汉字编码字符集基本集

GB/T 4880-1991 语种名称代码

GB/T 4880.2-2000 语种名称代码第2部分:3字母代码

GB/T 4881-1985 中国语种代码

GB/T 3792.1-1983 文献著录总则

GB/T 13959-1992 文件格式与代码编制方法

GB/T 15418-1994 档案分类标引规则

GB/T 3760-1995 文献叙词标引规则

GB/T 9704-1999 国家行政机关公文格式

GB 18030-2000 信息技术信息交换用汉字编码字符集基本集的扩充

GB/T 18894-2002 电子文件归档与管理规范

GB/T 7156-2003 文献保密等级代码

GB/T 19667 基于XML电子公文格式规范

DA/T12-1994 全宗卷规范

DA/T13-1994 档号编制规则

DA/T18-1999 档案著录规则

DA/T 19-1999 档案主题标引规则

DA/T 22-2000 归档文件整理规则

DA/T 1-2000 档案工作基本术语

中办发[1996]14号中国共产党机关公文处理条例

国发﹝2000﹞23号关于发布《国家行政机关公文处理办法》的通知

国档发[1987]4号关于颁发《编制全国档案馆名称代码实施细则》的通知

ISO15489 信息与文件—文件管理

ISO23081-1 信息与文献—文件管理流程—文件元数据-总则

ISO23081-2 信息与文献—文件管理流程—文件元数据-概念与实施问题

ISO14721 空间数据和传输系统—开放档案信息系统—参考模型

ISO11179 信息技术--元数据元素的规范与标准化

ISAD(G)档案著录规则(总则)

W3C Namespaces in XML XML的命名空间(Namespaces)

4.术语与定义

下列术语和定义适用于本标准。

4.1通用术语

4.1.1业务系统Business system

将硬件、软件、信息或服务、政策、程序、人有机地组合在一起,实现对机构业务信息的保存、整理和提供。如:电子政务系统、办公自动化系统等。

4.1.2电子文件管理系统 Electronic Records Manage System (ERMS)

为了满足业务对电子文件管理需要而设计的系统,用以捕获、保存、提供获取业务处理过程中产生的有证据价值的文件的功能。电子文件管理系统包括:档案工作者和文件使用者;授权政策、责任分配、权力授予、程序和做法;政策声明、程序手册、用户指南和其他用以批准和颁布政策的文件、程序和做法;文件本身;控制和记录的专门资料和文件系统;软件、硬件、其它设备、必要工具等。

4.1.3实体Entity

指过去、现在和将来存在的任何具体或抽象的事物以及它们之间的联系。比如:人、物体、事件、想法、过程等等。

4.1.4文件实体Record entity

在处理公务或事务过程中,由团体或个人形成或接收和保存的任何形式或载体的记录信息。可以是单份文件,也可以是文件的集合。

4.1.5责任者实体Agent entity

对文件的信息内容负有责任的个人或团体。

4.1.6业务实体Business entity

指业务过程中对文件进行处理与管理的一系列活动。

4.1.7关系实体Relationship entity

描述文件、责任者、业务等实体自身、相互关系及这种关系的背景信息实体。

4.1.8电子文件元数据Electronic Records Metadata

描述电子文件内容、背景和结构信息及整个管理流程的数据。

4.1.9元数据集Metadata schema

规定和描述标准元数据集元素以及元素间相互关系的框架。语句集为元数据元素提供正式的结构(句法)和语义(定义)。

4.1.10元数据结构Metadata structures

元数据集由一系列的元素组成,元素之间的相互关系形成了元数据的结构。元数据结构体现元数据扩展的方法与机制。元数据抽象模型的建立对其元素的扩展与整个元数据方案的规范具有参考作用。

4.1.11元数据语义Metadata Semantic

元数据的本质是描述对象的各种属性及相关关系等内容,每一个元素的语义明确定义了其含义、内涵与外延。语义定义是一个元数据规范的基本要素,也是元数据应用与元数据互操作的最重要的基础。

4.1.12元数据句法Metadata syntax

句法的问题即是一个形式化描述的问题,元数据集所有语义与结构及描述的内容以计算机可读或人可读的形式化方法描述出来。从标准、开放、互操作角度,采用标识语言对元数据集进行描述。本标准采用XML语言对元数据集进行描述。

4.1.13编码体系 Encoding Scheme

编码体系有助于对元素修饰词值的理解。这类体系包括控制词表及正规的符号或解读方式。值的表示采用来自控制词表的标记符号(如分类体系或主题词表的术语)或者具有特定含义,或以一定形式组成的字符串。

4.1.14信息总体 Information Package

电子文件与其元数据可以分开保存,也可以被封装在一起保存,后者称为电子文件信息总体。封装是指创建的一个由电子文件及其元数据组成的自我包含的实体。

信息总体便于对电子文件的独立理解,支持并长期保证电子文件的真实性、可靠性和完整性,同时提供电子文件与其形成背景之间的可靠而有意义的逻辑联系。

电子文件封装入信息总体,该文件可以存在于任何存储或操作环境中,因其包含了嵌入其中的有关开始和过程的所有细节,包括那些用于存取、传递和表述文件的细节。信息总体需要将元数据捕获的多个点包含进文件,因为文件的处理历史像其最初的捕获元数据一样至关重要。

本标准采用ISO14721《信息技术--元数据元素的规范与标准化》定义的封装技术,定义了信息总体的封装格式,包含维护真实性的技术机制。

信息总体封装格式(E ncapsulating Format for I nformation P ackage - EIP)见附录B。.

4.1.15信息总体固化 Fixity of Information Package

电子文件元数据与其文件一样,需要受真实性规则、规范或标准的控制,以保证电子文件具有可信性,这种控制称为元数据固化。本标准采用数字签名技术来进行信息总体的固化。

4.2数据模型概念

4.2.1属性Attribute

物体或实体的特征。

4.2.2类别Class:

对具有相同属性,操作,方法,关系和语义的对象集的描述。

4.2.3概念数据模型/概念模型Conceptual data model/conceptual model

通过数据模型对现实世界进行抽象地表达。

5.总则

电子文件形成、捕获、登记、分类、存储和保管、利用、跟踪、处置、传输、归档移交及长期保存等过程中都需记录在元数据中,并应保持连续、一致,以确保电子文件的真实性、完整性与有效性。为实现电子文件全过程管理与监控,电子文件及其元数据与结构稳定、定义良好的元数据标准相一致,特制定本标准。

本标准的制定遵循国际文件管理的系列标准规范: 按ISO15489《信息与文件—文件管理》规定的文件管理过程要求定义电子文件管理元数据,采用ISO/TS 23081《信息与文献—文件管理流程—文件元数据》定义的电子文件管理元数据概念模型、实体及关系模型;采用ISO14721《空间数据和传输系统—开放档案信息系统—参考模型》定义的信息包(SIP、AIP及DIP)数据模型,实现电子文件内容、背景、结构信息的封装,以确保在分散与集中管理过程中电子文件的真实性、完整性、有效性,确保电子文件在不同应用系统间的安全传输;采用ISO14721定义的数字信息长期保存模型,实现电子文件的长期保存与利用。

本标准支持元数据值的再利用、元数据元素的互操作及可扩展性和模块化。

元数据来源于机构文件处理方案、主题词表或关键词表、编码方案、电子政务系统、办公自动化系统、电子文件管理系统、档案管理系统、E-mail系统、网站。

6.元数据概念模型

文件管理业务系统的各个流程,需要通过元数据实现对文件或档案的管理。元数据最主要的用途之一是用来描述业务系统中实体。关键实体如下:

文件实体:文件本身,不管是单份文件还是文件集合体;

责任者实体:业务环境中的人或组织结构;

业务实体:业务办理。

根据元数据类型,可将元数据分为下列几类:关于文件自身的元数据、关于责任者的元数据、关于业务工作或过程的元数据、关于业务规章制度、政策以及法规的元数据、关于文件管理过程的元数据。

图1 主要实体及其相互关系

电子文件元数据模型的建立是以文件连续体理论为基础的。文件实体、责任者实体和业务活

动实体,是用元数据帮助确保文件真实性、完整性和有效性,实施档案化管理必须充分关注的要素。

文件作为交流、传递、贮存、利用信息的工具,其生成、处理、运转必然与文件责任者处理某项事务相关。对该事务的办理,形成文件的业务活动,构成了文件的来源

..。这种业务活动构成了文件的背景。

责任者作为文件的形成和处理者,为业务活动或事务处理活动的实施者。作为业务活动的主体,责任者与业务活动的推进息息相关,人们的业务活动自身也是划分为一定层次并且与相关文件群体(文件集合)的层次相对应。从微观到宏观区分为以下层次:1)事务处理:即处理每一件具体事务的业务活动,在这种业务活动中形成的文件一般情况下可以构成一个文件组合(案卷)。2)业务活动:即处理某种类型事务而进行的职能活动,有可能是由某个机构的一个职能部门进行;也可能该职能活动属于某个相对独立的业务活动项目,是其中的一个子项目。在这种职能活动中形成的文件,往往构成全宗内的一个类别(系列)。3)业务职能:即具有相对独立性的业务活动过程。其中以主体为核心的,是由一个立档单位进行的全部业务活动,在该项业务活动中形成的全部文件往往构成一个主体全宗;以客体为核心的相对独立而又具有相当规模的业务活动,则是围绕着该客体而跨立档单位进行的,所形成的文件一般情况下可以构成一个客体全宗。

人们进行的业务活动,同时也决定了文件所拥有的和将要拥有的各种有机联系。除了在处理

同一项业务活动过程中形成的所有文件相互之间

......的联系以外,还有:业务活动与文件的联系;业务活动承担者(即文件形成者和处理者)与文件的联系。它们是与文件的形成产生过程同步共生的。因此,(由业务活动承担者进行的)“业务活动”所诱发形成的“与文件有关的各种有机联系”是文件来源信息的重要组成部分,因而也是文件背景信息的重要组成部分。

7.电子文件元数据集(Metadata schema)

7.1电子文件元数据元素简表

7.1.1文件实体(Record Entity)

1.1 文件层级(Record Category)

1.2文件标识(Record Identifier)

1.3 文件题名(Record Title)

1.4文件分类(Record Classification)

1.5 文件主题(Record Subject)

1.6文件摘要(Record Abstract)

1.7文件日期(Record Date)

1.8文件语种(Record Language Type)

1.9文件种类(Record Form)

1.10文件覆盖范围(Record Coverage)

1.11文件技术环境(Record Technical Environment.)

1.12文件位置(Record Location)

1.13文件权限(Record Rights)

1.14文件处置(Record Disposal)

1.15文件管理历史(Record Management History)7.1.2责任者实体(Agent Entity)

2.1责任者层级(Agent Category)

2.2责任者标识(Agent Identifier)

2.3责任者描述(Agent Description)

2.4责任者权限(Agent Rights)

2.5责任者行为历史(Agent Activity History)

7.1.3业务实体(Function Entity)

3.1业务层级(Function Category)

3.2 业务标识(Function Identifier)

3.3 业务法规依据(Function Mandate)

3.4业务描述(Function Description)

3.5业务权限(Function Rights)

3.6业务处理过程(Function Event Identifie r)

7.1.4关系实体(Relation Entity)

4.1关系实体标识(Relation Entity Identifier)

4.2关系实体类型(Relation Entity Classification)

4.3相关实体标识(Identifier Of The Related Entity)

4.4相关实体类型(Type Of The Related Entity)

4.5关系定义(Relationship Definition)

4.6关系时间(Relationship Time)

7.1.5长期保存实体(Preservation Entity)

5.1签名信息(Signature Info)

5.2锁定签名信息(Lock Signature Info)

5.3编码(Encoding)

7.2电子文件元数据总体框架表

7.3电子文件元数据模块元素及应用层次对应表7.3.1文件实体(Record Entity)

7.3.2责任者实体(Agent Entity)

7.3.3业务实体(Function Entity)

7.3.4关系实体(Relation Entity)

7.3.5长期保存实体(Preservation Entity)

8.电子文件元数据元素定义方法

本标准对元数据的定义采用国际标准ISO11179-3:2003《信息技术--元数据元素的规范与标准化》和国际上元数据开发应用的最佳实践来完成。元数据元素的语义构成采用11个属性来描述:

9.电子文件元数据元素定义及描述9.1文件实体Record Entity

9.1.1文件层级Record Category

9.1.2文件标识Record Identifier

9.1.3文件题名Record Title

9.1.4文件分类Record Classification

9.1.5文件主题Record Subject

9.1.6

文件摘要Record Abstract

9.1.7文件日期Record Date

9.1.8文件语种Record LanguageType

9.1.9文件种类Record Form

9.1.10文件覆盖范围 Record Coverage

9.1.11文件技术环境 Record Technical Environment

9.1.12文件位置Record Location

电子文件元数据规范

电子文件元数据规范 1 范围 本规范适用于九省区各级国家档案馆、各级党政机关、社会团体、企事业单位对电子文件进行以保证凭证性为目的的管理活动。其他社会组织可参照执行 在电子文件管理过程中使用元数据可实现以下目的: ——确保并证明归档电子文件的真实性、完整性与有效性,从而保证其凭证价值; ——有利于归档电子文件的保护,实现长期保存; ——在异构的信息系统中对归档电子文件进行规范、有效的管理,保证归档电子文件的可捕获、可收集、查长期利用; ——对归档电子文件及馆(室)藏档案数字化资源进行集成管理,实现有效、方便地查询、检索与利用。 2 规范性引用文件 下列文件中的条款通过本规范的引用而成为本规范的条款。凡是注明日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本规范,然而,鼓励根据本规范达成协议的各方研究是否可使用这些文件的最新版本。 GB 2312-1980 信息交换用汉字编码字符集基本集 GB/T 3760-1995 文献叙词标引规则 GB/T 3792.1-1983 文献著录总则 GB/T 7156-2003 文献保密等级代码 GB/T 7408-2005 数据元和交换格式信息交换日期和时间表示法 GB/T 9704-1999 国家行政机关公文格式 GB/T 11714-1997 全国组织机构代码编制规则 GB/T 11821-2002 照片档案管理规范 GB/T 13959-1992 文件格式与代码编制方法 GB/T 13967-1992 全宗单 GB/T 15418-1994 档案分类标引规则 GB 18030-2000 信息技术信息交换用汉字编码字符集基本集的扩充 GB/T 18894-2002 电子文件归档与管理规范 DA/T 1-2000 档案工作基本术语 DA/T 12-1994 全宗卷规范 DA/T 13-1994 档号编制规则 DA/T 18-1999 档案著录规则 DA/T 19-1999 档案主题标引规则 DA/T 22-2000 归档文件整理规则 DA/T 31-2005 纸质档案数字化技术规范 《中华人民共和国电子签名法》 中办发[1996]14号中国共产党机关公文处理条例 国发﹝2000﹞23号关于发布《国家行政机关公文处理办法》的通知 国档发[1987]4号关于颁发《编制全国档案馆名称代码实施细则》的通知 国家档案局第6号令《电子公文归档管理暂行办法》,2003年7月28日 国家档案局第8号令《机关文件材料归档范围和文书档案保管期限规定》,2006年12月19日ISO 15489 Information and documentation—Records management ISO 23081-1 Information and documentation – Records Management Processes – Metadata for Records—Part 1: Principles

电子档案元数据的管理方案

龙源期刊网 https://www.wendangku.net/doc/851650269.html, 电子档案元数据的管理方案 作者:陈兰 来源:《经营者》2018年第06期 摘要随着社会的进步和信息技术的不断发展,越来越多的电子文件在其归档后就形成了电子档案,这种电子档案是保存各种电子文件的重要工具。其中,元数据是这种电子档案的基础,它又被叫作“关于数据的数据”,是记录各种电子文件全部信息的重要工具,通过元数据可以实现对各种重要的电子文件的完整性、真实性的保护。 关键词电子档案元数据管理方案 元数据的准确定义为:对各种信息资源进行结构化的描述,提供关于信息资源或数据的一种结构化数据。它可以对各种电子数据本身的特征和属性进行描述,具有发现、检索、管理、描述等功能。目前基于元数据的电子档案管理已经广泛应用于各行各业。本文对元数据在电子档案管理中的功能、电子档案元数据管理方案等几个方面进行研究和探讨。 一、元数据在电子档案管理中的作用 (一)保证电子档案的真实性和完整性 因为电子档案与实体分离,并且可以通过相关的操作进行变更,所以它的真实性往往会受到怀疑。但是,如果电子档案有了元数据,就可以将整个电子档案的形成、利用、处理的过程记录下来,从而保证整个电子档案的真实性和完整性。 (二)确保电子档案的长期可读性 我们知道,电子档案的生成和保存主要是依靠电脑和一些软件,一旦电脑或者是软件运行出现问题,电子档案就无法识别。在这种情况下,就可以利用元数据建立相应的模型对电子档案的格式信息、制作信息、转换方式等进行详细的记录与描述,这样就可以在电子档案迁移过程中保证其完整性和可读性。 (三)具有发现、检索、管理、描述等基本功能 元数据最基本的功能就是描述功能,它可以对档案信息对象的属性和位置进行详细的描述,从而将所找对象的基本信息呈现在人们面前。此外,因为元数据将主要信息展示出来了,所以就便于人们快速查找所需信息。同时,元数据还可以对各种资源对象的各个部件之间的结构和关联模式进行管理。 二、电子档案元数据的管理方案

元数据管理方案

元数据管理方案

元数据管理方案 1.1元数据抽取 为了简化元数据生成工作,系统提供自动生成元数据的功能,即元数据抽取。经过元数据自动抽取,用户能够方便、快捷地获得大量的元数据信息。 1.1.1抽取的对象 元数据抽取主要针正确对象有以下几种: 已有目录:已建业务应用系统中现有的目录资源。 数据库:各种数据库资源,包括关系型数据库、XML数据库等。 格式化电子文件:电子文件,例如Word、PDF、XLS等文件。 1.1.2元数据抽取的流程 元数据抽取的流程有4个主要步骤,分别为: 数据源信息获取:解决要从哪个数据源获得元数据的问题。 内容/结构分析:解决要从数据源中获得哪些元数据的问题。 元数据提取:解决如何从数据源中获取元数据的问题。 存储入库:解决元数据存储的问题。

1.1.3电子文档的元数据抽取 对于电子文档,首先各部门的文档格式不尽相同,另外它们的安全级别也各不相同,同时由于信息化建设水平的不一致,有的部门文档分散在各处,有的部门文档是集中存放的,甚至已经建立了完善的电子系统进行管理。 针对以上状况,对于电子文档的元数据抽取需要进行以下的抽取流程: ●整理归档 对于分散在各处的电子文档(纸质文档需要先进行电子化处理),必须由专人进行统一整理,根据公开共享的前提进行集中,这种集中能够是物理上集中的,也能够是逻辑上集中的。但要满足以下原则,第一根据安全级别,便于外界访问;第二便于文档的增量发布;第三便于采集工具的自动化采集编目。各部门只有在文档完全整理归档的情况下,进行自动化采集才是切实可行的。在整理归档的时候,各部门根据各自情况进行归档,没有必要千篇一律,也没有必要制定繁琐和呆板的规则,只要能够满足以上的原则即可。 ●根据安全级别,建立相应的访问机制 由于受到安全级别的限制,因此对于需要共享的数据要进行安全方面的限制,限制的手段能够有:用户名/密码、数字证书、物理隔断等等,根据实际情况建立安全访问机制,做到重要信息不泄露,不丢失。 ●编目处理

第三章 电子文件

第三章电子文件 第一节电子文件概述第二节电子文件管理概述第三节电子文件形成、办理和归档 第一节电子文件概述 1.1电子文件的含义 1.2电子文件与相关概念的辨析 1.3电子文件的基本特点 1.4电子文件的种类 1.5电子文件与元数据 1.1电子文件的含义 学术界、档案管理层从不同视角看到了其不同的特征,并出于不同的目的做出或具体、或抽象、或严谨、或深刻的定义,其中较有影响的定义有两个来源: 《电子文件归档与管理规范》( GB/T18894-2002) : 《电子文件管理暂行办法》(中办国办厅字2009,39号) 1.1电子文件的含义 电子文件指在数字设备及环境中生成,以数码形式存储于磁带、磁盘、光盘等载体,依赖计算机等数字设备阅读、处理,并可在通信网络上传送的文件。(《电子文件归档与管理规范( GB/T18894-2002)》) 理解电子文件的含义主要把握以下内涵: ★来源主要从三个方面:公务活动、社会活动和传统载体转换; ★“数字信息”和“文件”的交集:是具有文件功能的数字信息,又是以数字信息为技术特征的文件; ★电子文件由内容信息、背景信息、结构信息三要素构成。 1.2电子文件与相关概念的辨析 机读文件虚拟文件数字文件电子档案 1.3电子文件的基本特点 ·电子文件的技术特点:主要包括非人工识读性、生成环境依赖性、信息与载体的可分离性、信息的易变性、多种媒体的集成性、信息存储的高密度性、信息的可操作性等。 ·电子文件的形成特点:是指电子文件从制作到生成过程中所表现出来的内在规定性。特点主要包括电子文件与机构活动的伴生性、电子文件之间的有机联系性、电子文件内容和结构以及背景信息的分散性、电子文件技术状态的多样性等。两个影响因素:即技术要素和机构职能与文件类型要素。 1.4电子文件的种类 ·按电子文件的适用范围分为通用电子文件、专用电子文件、私人电子文件等; ·按文件功能可划分为主文件、支持文件; ·按文件组成方式可划分为简单文件、复合文件、复杂文件; ·按信息存储载体可划分为磁盘文件、磁带文件、光盘文件; ·按文件来源途径可划分为原生电子文件、数字化电子文件。 ·按电子文件的信息存在形式分为文本文件、数据文件、图形文件、图像文件、音频文件、视频文件、命令文件等 1.5电子文件与元数据 ·元数据是电子文件不可分割的的组成部分,是电子文件管理不可或缺的重要工具之一。只有在掌握元数据的基础上,才能对电子文件进行有效而安全的控制,保证电子文件的完整性、真实性、可靠性和有效性,同时元数据也是电子文件信息组织、维护和检索的重要依据。 1.5.1元数据概念 ·元数据(metadata)是信息技术出现后才出现的概念,其一般性解释为“关于数据的数据”,

电子证照数据标准

电子证照数据标准

ICS13.220.10 点击此处添加中国标准文献分类号DB35 福建省地方标准 DB 35/ T XXXX—2015 电子证照数据标准 点击此处添加标准英文译名 点击此处添加与国际标准一致性程度的标识 (工作组讨论稿) XXXX-XX-XX发布XXXX-XX-XX实施

目次 前言....................................... II 1 范围 (1) 2 规范性引用文件 (1) 3 术语和定义 (1) 4 证照目录组成 (2) 4.1 证照名称 (2) 4.2 证照目录信息 (2) 5 电子证照编号 (2) 6 电子证照文件组成 (3) 6.1 电子证照元数据 (3) 6.1.1 基本元数据 (3) 6.1.2 扩展元数据 (3) 6.1.3 元数据要求 (3) 6.2 电子证照照面内容 (3) 6.2.1 电子证照模版 (4) 6.2.2 电子证照照面信息 (4) 6.3 签发单位电子印章 (4)

6.4 数字签名 (4) 7 电子证照文件封装 (4) 7.1 封装内容 (4) 7.2 封装方法 (4) 7.3 逻辑结构 (4) 附录A(资料性附录)电子证照目录信息 (5) 附录B(规范性附录)照面信息元数据字典XML结构 (6) 附录C(规范性附录)颁证单位/持证者代码类型编码 (11) 附录D(规范性附录)基本元数据的信息结构.. 12附录E(规范性附录)扩展元数据的信息结构.. 13附录F(规范性附录)电子证照XML数据文件.. 14

前言 本标准按GB/T 1.1-2009《标准化工作导则第1部分:标准的结构和编写》给出的规则起草。 本标准由福建省数字福建建设领导小组办公室提出。 本标准由福建省信息化标准化技术委员会归口。 本标准起草单位:福建省空间信息工程研究中心、福建省数字福建建设领导小组办公室、福建省经济信息中心、福建凯特信息安全技术有限公司。 本标准主要起草人:朱勤东、郑彦翎、李鹏伟、涂平、林丽、郑剑平。

CELTS-42基础教育教学资源元数据规范1

基础教育教学资源元数据应用规范 (CELTS-41) 教 育信息化技术标准 CELTS-42 基础教育教学资源元数据规范 CELTS-42 CD1.6 教育部教育信息化技术标准委员会 发布

目录 1 概述 (2) 1.1 目的 (2) 1.2 范围 (2) 2 规范性引用文件 (2) 3 术语定义与缩略语 (3) 3.1 本应用规范使用的基础术语 (3) 3.2 缩略语 (5) 4 元数据元素属性定义 (6) 4.1 元数据元素的属性描述 (6) 4.2 数据元素定义的规定 (7) 5 元数据结构 (7) 5.1 元数据的基本结构 (7) 5.2 元数据元素及定义 (7) 6 限定词汇与编目词汇表 (11) 6.1 限定词汇 (11) 6.2 本规范的限定词与编目方式定义 (14) 6.3 受控词汇和编目方案 (22) 6.4 一致性 (29) 7 参考文献 (31) 附录 A 供参考的部分教育学科课程分类第三级词汇表(课程内容) (33) A.1 语文课程内容分类 (33) A.2 数学课程内容分类 (34) A.3 英语课程内容分类 (37) A.4 地理课程内容分类 (38) A.5 历史课程内容分类 (39) A.6 化学课程内容分类 (40) A.7 物理课程内容分类 (43) A.8 生物课程内容分类 (48) A.9 信息技术课程内容分类 (49) A.10 音乐课程内容分类 (50) A.11 美术课程内容分类 (50)

CELTS-42基础教育教学资源元数据规范 1 概述 1.1 目的 本规范提供一个面向基础教育的教学资源数据模型。制定本规范旨在对希望在学校、企业、其他机构和个人的教学资源中使用元数据的用户提供一套资源编目准则,以使读者能快速、有效地在国家基础教育资源库及门户网站中检索到所需的教学资源,广泛地实现资源共享。 1.2 范围 本规范在《CELTS-3学习对象元数据:信息模型规范》(以下简称《学习对象元数据规范》)的基础上,结合我国基础教育的实际,定义了一组面向基础教育的教学资源元数据元素。 本规范依照教育部颁布的《义务教育课程设置实验方案》、《义务教育各学科课程标准(实验稿)》以及《学习对象元数据规范》,同时参考《都柏林核心集元数据(DCMES)》、《中国图书馆图书分类法》、美国GEM项目及澳大利亚EdNA项目的词汇分类方法,定义了一组用于元数据元素编目的受控词汇及相应的词汇表。 本规范通过与《学习对象元数据规范》的元素间映射来实现与CELTS的一致性。 本规范包括﹕ ?概述 ?规范性引用文件 ?术语定义与缩略语 ?元数据元素属性定义 ?元数据结构 ?限定词汇及编目词汇表 ?一致性 ?参考文献 2 规范性引用文件 下列文件中的条款通过本规范的引用而成为本应用规范的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本应用规范。然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本应用规范。 ?ISO 639:规定人类语言表示方法的国际标准。 ?ISO 646:规定ASCII字符集的国际标准。 ?ISO 8601:规定日期和时间表示方法的国际标准。 ?ISO 3166:规定国家名称表示方法的国际标准。

上海市电子档案移交和接收管理办法.pdf

上海市电子档案移交和接收管理办法 第一章总则 第一条为了规范电子档案移交与接收工作,确保电子档案真实完整、安全可靠、长期可用,根据《上海市档案条例》和国家档案局《电子档案移交与接收办法》,制定本办法。 第二条本办法所称电子档案,是指具有凭证、查考和保存 价值并归档保存的电子文件。 本办法所称电子文件,是指国家机构、社会组织或个人在履行其法定职责或处理事务过程中,通过计算机等电子设备形成、 办理、传输和存储的数字格式的各种信息记录。 第三条凡本市立档单位向国家综合档案馆移交电子档案及 档案馆接收电子档案适用本办法。 第四条各级档案行政管理部门负责对电子档案的移交、接 收工作进行监督和指导。档案移交单位和各级国家综合档案馆应当切实履行电子档案移交和接收职责。 第五条移交与接收的电子档案应当真实可靠、齐全完整和 安全可用;涉密电子档案的移交与接收应当符合国家有关保密安 全的要求。

第六条国家综合档案馆接收电子档案的范围,参照国家和 本市有关档案进馆范围的规定,包括记录各单位核心业务和重要 工作成果的文书、科技、专业、音像等类电子档案。 第七条属于接收范围的电子档案一般自形成之日起5年内向国家综合档案馆移交。对于有特殊要求的电子档案,可以适当延长移交时间。 第二章电子档案的移交 第八条电子档案的移交应当符合以下基本要求: (一)电子档案的元数据和目录文件应与电子档案一并移 交,并与电子档案建立关联关系,电子档案的存储结构见附件1。 (二)电子档案有纸质等异质载体的,应当在目录文件中记 录相关信息,异质载体的移交时间、整理要求按照国家和本市现 有的档案移交规定执行。 (三)采用技术手段加密的电子档案应当解密后移交,压缩的电子档案一般应当解压缩后移交。 (四)移交单位应当将已移交的电子档案在本单位备份保存 至少5年。

元数据方案分析实验报告

武汉大学教学实验报告 信息管理学院信息管理与信息系统专业2011年1 月1 日 实验名称元数据方案分析指导教师Loly 姓名hrvy 年级2008 学号2008302330000 成绩 一、预习部分 1.实验目的 2.实验基本原理 3.主要仪器设备(含必要的元器件、工具) 1 2 3 实验目的: 通过自学包括DC在内的多种元数据方案,对其进行一定程度的分析,加深对元数据的理解,体会元素据方案的具体应用及其作用——如何实现机器与客户之间的接口,进一步感受信息组织的涵义作用,加深对本课程的理解与认识。 实验基本原理: 从网络上寻找任一种元数据方案(DC除外),对其进行简单介绍并仔细分析其元素涵义,最后通过一个具体的实例将自己所了解的知识贯通。 主要仪器设备: 一台连接到因特网的电脑。 二、实验操作部分 1.实验数据、表格及数据处理 2.实验操作过程(可用图表示) 3.结论 1 实验数据、表格及数据处理: 本实验采用的是LDIF元数据方案。 LDIF:LDIF 全称是 LDAP(Lightweight Directory Access Protocol,轻量级目录访问协议) Data Interchange Format ,轻量级目录访问格式数据交换文本。LDIF中传达的一组记录目录的内容,每一个对象(或项目)的纪录。它代表了一组记录的更新请求,如添加,修改,删除,重命名,为每个更新请求的记录。LDIF 是一种普遍使用的文件格式,用来描述目录信息或可对目录执行的修改操作。LDIF 完全独立于在所有特定目录中使用的储存格式,LDIF 通常用于从LDAP 服务器导出目录信息或将数据导入LDAP 服务器。 LDIF 一般很容易生成。因此,可以借助于一些工具(如awk 或perl)将专有格式的数据移入LDAP 目录。也可以编写脚本来生成LDIF 格式的测试数据。 LDIF 由两部分组成,第一部分是前两行,版本和 dn ,后面是属性和值。有两种类型的 LDIF 文件:第一种是描述 Directory 条目数据的,第二种是描述更新条目的。 第一种: version: 1 #定义版本 dn: uid=bjensen, ou=people, dc=example, dc=com #定义判别名:用户UID,组织

电子文件管理考题

电子文件管理 一、单选题 1.电子文件中,一般用于描述图像文件的分辨率的是( C )P52 A.DPI B.DBF C.PPI 2.电子文件归档移交前其真实性、完整性、安全性及可识别性,由(B)部门负责,归档移交后由(A)负责。P101 A.档案 B.形成 C.系统软件 3.电子文件归档“双轨制”是指(C)P102 A.制定电子文件归档制度,并认真实施。 B.将归档的纸质文件扫描成图片归档。 C.将生成的电子文件同时打印一份纸质文件,与其一并归档。 4.在销毁电子文件时,对属于涉密的归档电子文件,(B) A.可以用逻辑删除的方法 B.必须连同存储载体一起销毁 P111 C.送纸厂销毁 5.《电子文件管理条例》归档电子文件的形成部门和档案保管部门应当对归档电子文件集中拷贝至耐久性好的载体上,一式(C)套,其中一套异地保管。P109-110 A.一 B.二 C.三

6.草稿性电子文件的归档时,应该(A) A.保留其修改痕迹 B.不用留其修改痕迹 C.无所谓 7.归档电子文件刻录光盘后,其光盘标签按要求应(B) A.写上光盘档号 B.用黑色油性软笔在归档光盘的标签面上写上光盘档号 C.在归档光盘的标签面上贴上标签 二.多选题 1.在电子文件管理中,下列关于TIFF与JPEG说法正确的是(ABCD)P54-56 A.TIFF格式图片质量高,文件体积大,用于保存高质量的图片。 B.JPEG格式压缩比例较高,图片质量不及TIFF格式,文件体积较小,适合保存图像要求质量不高的图片,或用于普通网页浏览使用。 C.TIFF支持多页模式,JPEG不支持多页模式。 D.JPEG2000颠覆了JPEG只能是有损压缩的传统。 2.在电子文件管理中,下列格式中属于电子公文存储通用格式的是(ABD)P96

国家基础地理信息系统元数据标准(草案)

国家基础地理信息系统(NFGIS)元数据标准草案(初稿) 1. 主题内容与适用范围 本标准提供国家基础地理信息系统(NFGIS)元数据的内容,包括NFGIS数据的标识、内容、质量、状况及其他有关特征。本标准可用于对NFGIS数据集的全面描述、数据集编目及信息交换网络服务。 2. 参考标准 ISO 15046-15地理信息--元数据(CD 2.0) FGDC 地理空间数据元数据内容标准(CSDGM)v.2.0 3. 术语 3.1 元数据 是关于数据的数据,即关于数据的内容、质量、状况和其他特性的信息。也可译为描述数据或诠释数据。 3.2 元数据元素(元数据Element) 元数据最基本的信息单元。 3.3 元数据实体(元数据Entity) 同类元数据元素的集合。 3.4 元数据子集(元数据Section) 相互关联的元数据实体和元素的集合。 3.5 信息交换网络(Clearinghouse) 数据生产者、管理者和用户之间的分布式、电子连接的网络。 3.6 数据志(Lineage) 数据继承信息,包括获取或生产数据使用的原始资料说明、数据处理中的参数、步骤等情况及负责单位的有关信息等。 3.7 引用文献(Citation) 数据集引用或参考使用的资料、数据集、模型、文献等。 4. NFGIS 元数据层次结构和性质 4.1 元数据层次结构 本标准规定NFGIS元数据分为三层:元数据子集、元数据实体和元数据元素。 元数据元素是元数据的最基本的信息单元,元数据实体是同类元数据元素的集合,元数据子

集是相互关联的元数据实体和元素的集合。在同一个子集中,实体可以有两类即简单实体和复合实体,简单实体只包含元素,复合实体既包含简单实体又包含元素,同时复合实体与简单实体及构成这两种实体的元素之间具有继承关系。 4.2 元数据性质 本标准定义三种性质的元数据子集、实体和元素: 必选(Mandatory)──元数据的核心内容,适用于各种被描述对象,是元数据文件必须包含的子集、实体或元素。 一定条件下必选(Conditional )──针对不同的被描述对象特征元数据文件所必须提供的子集、实体或元素。 可选(Optional)──该子集、实体或元素是可选的,由用户决定是否将其包含在元数据文件中。 5. NFGIS 元数据分级和特征 5.1 元数据分级 本标准规定元数据分为两级,即: 基本元数据──提供地理数据源基本文档所需要的最少的元数据元素集。它包括回答下列问题的元数据元素: "是否有特定主题的数据集('什么')?"、"是否有特定地区的数据集('何处')?"、"是否有特定时段的数据集('何时')?" 以及"订购或了解数据集更多情况的联系人('谁')? 完全元数据──提供完整的地理数据源(单独的数据集、数据集系列、各种地理要素)文档所需要的必选的和可选的元数据元素集。它完整地定义全部元数据,以便标识、评价、摘录、使用和管理地理信息。 5.2 元数据特征 本元数据标准定义了8种特征: 5.2.1 名称 赋给元数据实体或元素的标记。 5.2.2 标识码 计算机中使用的定义每个元数据实体和元素的唯一代码。代码结构为: xx xx xx 前两位为元数据子集,两位数字码 中间两位为元数据实体/独立元素,两位数字码 后两位为元数据实体包含的元素,两位数字码

从电子文件到电子档案

从电子文件到电子档案 一、概念 (一)电子文件 以数码形式记录于磁带、磁盘、光盘等载体,依赖计算机系统阅读、处理并可在通信网络上传输的文件。《档案工作基本术语》DA/T1—2000 国家机构、社会组织或个人在履行其法定职责或处理事务过程中,通过计算机等电子设备形成、办理、传输和存储的各种形式的信息记录。《电子档案管理基本术语(征求意见稿)》(2012年6月12日) 两者区别在于:后者着重强调了电子文件的形成和来源。 (二)电子档案 具有参考和利用价值并归档保存的电子文件。电子档案由内容、结构和背景组成。《电子档案管理基本术语(征求意见稿)》(2012年6月12日) 电子档案,是指通过计算机磁盘等设备进行存储,与纸质档案相对应,相互关联的通用电子图像文件集合,通常以案卷为单位。百度百科 二、相关术语定义 1、元数据 描述电子档案的内容、结构、背景及其整个管理过程的数据。 2、电子印章 采用数字技术对电子文件加盖的印章。 3、数字签名 依附于电子档案或在逻辑上与其相连的一个数字标记,表示签名者对档案责任和内容的认可。 4、数字水印 采用数字技术对电子文件加注的起信息固化作用的标记,可用于鉴别电子文件信息的原始性,起防错、防漏和防调换等作用。 5、文件格式 电子文件在计算机中的组织和存储方式。 6、打包 将电子档案及其元数据作为一个整体按指定结构封装的过程。 7、归档电子文件 指具有参考和利用价值并作为档案保存的电子文件。 8、背景信息 指描述生成电子文件的职能活动、电子文件的作用、办理过程、结果、上下文关系以及对其产生影响的历史环境等信息。 9、逻辑归档 指在计算机网络上进行,不改变原存储方式和位置而实现的将电子文件的管理权限向档案部门移交的过程。 10、物理归档 指把电子文件集中下载到可脱机保存的载体上,向档案部门移交的过程。 11、真实性 指对电子文件的内容、结构和背景信息进行鉴定后,确认其与形成时的原始状况一致。12、完整性 指电子文件的内容、结构、背景信息和元数据等无缺损。

元数据管理方案

元数据管理方案 元数据管理方案 1.1元数据抽取 为了简化元数据生成工作,系统提供自动生成元数据的功能,即元数据抽取。通过元数据自动抽取,用户可以方便、快捷地获得大量的元数据信息。 1.1.1抽取的对象 元数据抽取主要针对的对象有以下几种: 已有目录:已建业务应用系统中现有的目录资源。 数据库:各种数据库资源,包括关系型数据库、XML数据库等。 格式化电子文件:电子文件,例如Word PDF XLS等文件。 1.1.2元数据抽取的流程 元数据抽取的流程有4个主要步骤,分别为: 数据源信息获取:解决要从哪个数据源获得元数据的问题。 内容/结构分析:解决要从数据源中获得哪些元数据的问题。

元数据提取:解决如何从数据源中获取元数据的问题。 存储入库:解决元数据存储的问题。 1.1.3电子文档的元数据抽取 对于电子文档,首先各部门的文档格式不尽相同,另外它们的安全级别也各不相同,同时由于信息化建设水平的不一致,有的部门文档分散在各处,有的部门文档是集中存放的,甚至已经建立了完善的电子系统进行管理。 针对以上状况,对于电子文档的元数据抽取需要进行以下的抽取流程: 整理归档 对于分散在各处的电子文档(纸质文档需要先进行电子化处理),必须由专人进行统一整理,根据公开共享的前提进行集中,这种集中可以是物理上集中的,也可以是逻辑上集中的。但要满足以下原则,第一根据安全级别,便于外界访问;第二便于文档的增量发布;第三便于采集工具的自动化采集编目。各部门只有在文档完全整理归档的情况下,进行自动化采集才是切实可行的。在整理归档的时候,各部门根据各自情况进行归档,没有必要千篇一律,也没有必要制定繁琐和呆板的规则,只要能够满足以上的原则即可。 根据安全级别,建立相应的访问机制 由于受到安全级别的限制,所以对于需要共享的数据要进行安全方面的限制,限制的手段可以有:用户名/ 密码、数字证书、物理隔断等等,根据实际情况建立安全访问机制,做到重要信息不泄露,不丢失。 编目处理 现阶段,主流格式的电子文档,主要包含:word、excel 、ppt 、pdf 等。对主流格式的电子文档,要提供自动采集工具进行编目处理。采集的范围主要是文档的标题和内容,对于其它的元数据内容,要提供手工配置的方式进行辅助。另外,在工具的采集效率上,要提高增量文档发布后的采集效率。 对于格式特殊、内容有加密算法的文档,是很难通过抓取工具进行采集的,这些文档主要通过手工编目的方式来处理。 对于存在管理库的文档,就需要对数据库来进行编目采集,详见数据库元数据抽取部分。

何为档案中的元数据

元数据 元数据,英文拼写为Metadata,目前已被广泛应用于各种信息资源的管理领域中。在档案界,最早使用“元数据”的是美国的电子文件管理专家戴维?比尔曼,他在20世纪90年代初发表的有关电子文件管理方面的论文中首先使用了元数据这一术语。元数据的概念目前在档案界还没有一个统一的定论,目前比较有代表性的描述有:1.元数据是“关于数据的数据(Data about Data)”,其中,后一个Data是指被描述的信息资源,前一个Data则是指为理解该信息资源而存储的有关信息,即元数据。这是元数据目前公认最为经典、通俗和简洁的定义。2.国际档案理事会《电子文件管理指南》(1997)认为“元数据是关于文件的背景信息和结构的数据,是有关电子文件的技术性信息。”3.《澳大利亚联邦机构电子文件保管元数据标准》(1999)认为“文件保管元数据是关于电子文件背景的描述信息。”4.英国国家档案馆《电子文件管理指南》(1999)认为“元数据是关于文件和文件集合的背景及其相互关系的结构化描述和编目数据。”5.冯惠玲主编的《电子文件管理教程》认为元数据是“由电子文件系统自动记录的关于文件形成时间、地点、人员、活动、文件系统、结构及内容方面的具体数据。”6.“元数据可以理解为用来描述资源的属性与特征的信息。”-刘家真《电子文件管理理论与实践》,科学出版社2003年版。7.“元数据是对数据对象规范描述所形成的数据集合,通过计算机可读的开放语言来标记元数据,就能在系统间发现、交换、转换和理解相应的数字对象,支持系统间互操作。”-张晓林《开放元数据机制:理念与原则》,《中国图书馆学报》2003年3期。以上描述虽然表述各不相同,但我们可以发现一个共同点,即元数据主要是动态地描述电子文档各种特征的信息数据集合,并且它能为分散的、由多种数字化资源有机构成的档案信息体系提供整合的工具与纽带。随着研究的深入,我们对元数据的认识在逐步深化。档案工作人员为便于理解,可以简单把电子文档的元数据视为两方面:一是“著录信息或著录数据”。其中,“元数据元素就是著录项目,元数据格式就是著录项目之间关系的结构化表示,元数据编码就是著录信息的编制。”(刘越南《对电子文件管理元数据的再认识》,《档案学通讯》2005年2期);二是电子文档的内容、背景和结构等方面的信息。国外学者将元数据喻为电子文件管理系统中的“血液”,足见元数据在数字档案馆电子文件管理中发挥着举足轻重的作用。元数据的作用主要可以概括为以下几方面:1.元数据能协助数字档案馆构建信息检索机制。元数据具有动态跟踪功能,能够即时动态地获取电子文件管理的各项信息。在数字档案馆的海量信息库中,借助元数据,可以快速发现并获取特定的信息单元。 2.元数据能维护信息的识别与读取。电子文件所携带的元数据信息可以完整地记录电子文件的原始状态,能够系统地映射出电子文件的信息内容、背景和结构等;还能够映射出电子文件的生成环境和行政管理环境。只有在获取数据对象的同时也获取这些元数据信息,被检索到的数据单元才是可理解的、可读的。 3.元数据能保障电子文件的真实性与凭证性。元数据系统能够跟踪记录电子文件从产生那一刻起的载体、设备及所用技术的变迁史以及使用干预该文件的整个历史过程,即不论载体、设备、技术如何更新换代,不论使用者、使用人数的多少都全部作为历史数据保存下来,记录备案。这些为数字信息单元真实性和凭证性提供了重要的佐证。

4电子文件通用元数据规范

电子文件元数据标准 (征求意见稿) 1.范围 本标准适用于各级机关、团体、企事业单位、社会组织。本标准规定了电子文件元数据的结构、定义、编码体系。 本标准描述的数字对象为通用的电子文件核心元数据,主要为原生电子文件与数字化文件(文本、图像)元数据。根据发展需要,扩展编制图形、影像、声音等文件类型的元数据标准。 2.编制目的 2.1 对文件及相关实体进行标准化描述; 2.2 实现不同机构、不同系统之间文件及信息的互操作; 2.3 为电子文件在不同时间、不同空间、不同应用软件中的再利用提供统一的元数据; 2.4 为电子政务、办公自动化、电子文件中心、文档管理、档案管理等系统提供成熟的电子文件全过程管理的设计模式。 3.规范性引用文件 下列文件中的条款,通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 GB/T 2659-2000 世界各国和地区名称代码 GB/T 2260-2002 中华人民共和国行政区划代码 GB/T 11714-1997 全国组织机构代码编制规则 GB/T 9704-1999 国家行政机关代码编制规则 GB 2312-1980 信息交换用汉字编码字符集基本集 GB/T 4880-1991 语种名称代码 GB/T 4880.2-2000 语种名称代码第2部分:3字母代码 GB/T 4881-1985 中国语种代码 GB/T 3792.1-1983 文献著录总则 GB/T 13959-1992 文件格式与代码编制方法 GB/T 15418-1994 档案分类标引规则 GB/T 3760-1995 文献叙词标引规则 GB/T 9704-1999 国家行政机关公文格式 GB 18030-2000 信息技术信息交换用汉字编码字符集基本集的扩充 GB/T 18894-2002 电子文件归档与管理规范 GB/T 7156-2003 文献保密等级代码 GB/T 19667 基于XML电子公文格式规范 DA/T12-1994 全宗卷规范 DA/T13-1994 档号编制规则 DA/T18-1999 档案著录规则 DA/T 19-1999 档案主题标引规则 DA/T 22-2000 归档文件整理规则 DA/T 1-2000 档案工作基本术语

元数据与元数据标准现状

元数据与元数据标准现状 福建省空间工程研究中心黄瑞垠 目前国内外研究领域对元数据含义的理解虽然存在认识深浅的区别,但总体上达成了共识[[i]]。学者们大都认可“元数据是关于数据的数据”或“描述数据的数据”的观点,但对于其具体含义,又有不同阐述。张晓林等[[ii]]认为“元数据是描述信息资源或数据等对象的数据,其使用目的在于:识别资源、评价资源、追踪资源在使用过程中的变化,实现简单高效地管理大量网络化数据,实现信息资源的有效发现、查找、一体化组织和对使用资源的有效管理”。肖珑[[iii]]认为元数据“是用于提供某种资料的有关信息的结构化数据(Structured data)”。张智雄[[iv]]将元数据定义为“描述任何Internet数据和资源,促进Internet信息资源的组织和发现的数据”。李郎达[[v]]引用国际图联对元数据的定义:“Metadata即描述资料的资料,可用来协助对网络电子资源的辨识、描述、指示其位置的任何资料”。 根据以上定义,参考其他学者的观点,关于元数据,可小结如下: (1)元数据的目标:元数据的根本目标是使数据库更易于使用,或为计算机辅助软件工程(CASE)服务。 (2)元数据的内容:元数据包括对数据集的描述;对数据集中各数据项(来源、数据所有者、数据生产历史)等的说明;数据质量的描述,如:数据精度、分辨率、源数据的比例尺等;数据处理信息,如量纲的转换等;数据转换方法;数据库更新、集成的方法等等。 (3)元数据的性质:元数据是数据的描述性数据;对不同领域的数据库,元数据的内容有很大差异;元数据应尽可能反映数据的特征及规律。 (4)元数据的作用:通过元数据可以检索、访问数据库,可以有效利用计算机的系统资源,可以对数据进行加工处理和二次开发等。 在此基础上,我们将元数据概括为以数据高效利用和交换为目的的数据集说明性数据,它主要包括对数据集、与数据集相关信息、数据集各数据项说明以及数据用户访问、检索、更新数据库的方法,同时元数据也包括基于不同数据领域,如何尽可能全面反映基本数据的信息。

网页电子文件元数据XML Schema

附录A网页电子文件元数据XML Schema A.1 网页电子文件元数据的XML Schema结构图。 网页电子文件元数据的XML Schema结构图见图A.1-1、图A.1-2。 因为纸张幅面的限制,故将结构图分成两页进行显示。

图A.1-1 网页电子文件元数据的XML Schema结构图(上半部分)

图A.1-2 网页电子文件元数据的XML Schema结构图(下半部分)

A.2 网页电子文件元数据的XML Schema

大亚湾核电站电子文档元数据著录研究

大亚湾核电站电子文档元数据著录研究 作者:廉旭姣 来源:《办公室业务(上半月)》 2019年第12期 文/生态环境部核与辐射安全中心廉旭姣 【摘要】元数据在核电站电子文档管理中占据着重要地位,电子文档元数据描述了电子文 档的内容、属性、背景和结构等信息,较全面地反映描述对象的全过程,便于电子文档的检索、存取、利用以及信息共享等。大亚湾核电站电子文档的元数据,能够较好地解决电子文件的真 实性、完整性和长期可用性,提升电子文档管理和开发利用的效率,是实现电子文档凭证价值 和参考价值的重要工具。 【关键词】电子文档;元数据;著录 大亚湾核电站的文档管理贯穿于核电生产活动中的各个方面,根据HAF040《核电厂质量保 证安全规定》的要求,必须按照书面程序和指令建立和执行有关质量保证记录的产生、鉴别、 收集、标引、立卷、存放和处理的制度,必须在质量保证大纲实施过程中编写质量保证记录, 以证实核电厂已经按照特定要求完成影响质量的各项活动。为此,大亚湾核电站制定出了严格 的文档管理体系,具体的工作大致分为文档控制、文档管理和文档服务,从文件的产生、生效、分发、使用、记录报告的收集等各个环节进行了文件控制管理。为了有效地运作文件管理体系,依据《核电电子文件元数据》NB/T20418-2017的要求,分析大亚湾核电站文档管理元数据著录 的规范。 一、元数据标准体系 元数据标准体系由元数据标准框架、根据元数据标准框架扩展出来的专门元数据标准以及 对应的元数据标准管理系统和元数据著录系统构成。其中,元数据标准框架又由核心元数据标 准和它的扩展原则构成。它们之间的相互关系如图所示。 二、元数据元素定义方法 元数据表中各个元素都用13个属性进行描述:1.编号:按一定规则排列的元数据的顺序号。 2.中文名称:元数据元素的中文标识。 3.英文名称:元数据元素的英文标识。 4.定义:元数据 元素含义的描述。元数据的一般定义是关于数据的数据(data?about?data)。详细来讲,元数据是指提供关于信息资源或数据的一种结构化的数据,是对信息资源的结构化的描述。其作用是 描述信息资源或数据本身的特征和属性,规定数字化组织,具有定位、发现、证明、评估、选 择等功能。标识信息是指:根据文档的来源信息,为科学、有序地管理文件及档案而赋予文档

元数据的标准

元数据的标准 1、数字图书馆资源组织框架 2. 元数据开发应用框架 元数据的基本意义Metadata(元数据)是“关于数据的数据”; 元数据为各种形态的数字化信息单元和资源集合提供规范、普遍的描述方法和检索工具;元数据为分布的、由多种数字化资源有机构成的信息体系(如数字图书馆)提供整合的工具与纽带。 离开元数据的数字图书馆将是一盘散沙,将无法提供有效的检索和处理。 3. 元数据应用环境 3.1 Metadata的应用目的 (1)确认和检索(Discovery andentification),主要致力于如何帮助人们检索和确认所需要的资源,数据元素往往限于作者、标题、主题、位置等简单信息,Dublin Core是其典型代表。(2)著录描述(Cataloging),用于对数据单元进行详细、全面的著录描述,数据元素囊括内容、载体、位置与获取方式、制作与利用方法、甚至相关数据单元方面等,数据元素数量往往较多,MARC、GILS和FGDC/CSDGM是这类Metadata的典型代表。 (3)资源管理(Resource Administration),支持资源的存储和使用管理,数据元素除比较全面的著录描述信息外,还往往包括权利管理(Rights/Privacy Management)、电子签名(Digital Signature)、资源评鉴(Seal of Approval/Rating)、使用管理(Access Management)、支付审计(Payment and Accounting)等方面的信息。 (4)资源保护与长期保存(Preservation and Archiving),支持对资源进行长期保存,数据元素除对资源进行描述和确认外,往往包括详细的格式信息、制作信息、保护条件、转换方式(Migration Methods)、保存责任等内容。 3.2 Metadata在不同领域的应用根据不同领域的数据特点和应用需要,90年代以来,许多Metadata格式在各个不同领域出现 例如: 网络资源:Dublin Core、IAFA Template、CDF、Web Collections 文献资料:MARC(with 856 Field),Dublic Core 人文科学:TEI Header 社会科学数据集:ICPSR SGML Codebook 博物馆与艺术作品:CIMI、CDWA、RLG REACH Element Set、VRA Core 政府信息:GILS 地理空间信息:FGDC/CSDGM 数字图像:MOA2 metadata、CDL metadata、Open Archives Format、VRA Core、NISO/CLIR/RLG Technical Metadata for Images 档案库与资源集合:EAD 技术报告:RFC 1807 连续图像:MPEG-7 3.3 Metadata格式的应用程度 不同领域的Metadata处于不同的标准化阶段: 在网络资源描述方面,Dublin Core经过多年国际性努力,已经成为一个广为接受和应用的事实标准;在政府信息方面,由于美国政府大力推动和有关法律、标准的实行,GILS已经

相关文档
相关文档 最新文档