文档库 最新最全的文档下载
当前位置:文档库 › 档案数字化方案制定与实施

档案数字化方案制定与实施

档案数字化方案制定与实施
档案数字化方案制定与实施

关于档案数字化的实践与思考

当前,我国信息化发展战略的实施,电子政务的推进,为我国档案事业发展提供了难得的机遇。加强档案信息化建设是档案事业适应时代和社会发展的必然选择,是加速档案管理现代化的客观要求,是提高档案服务水平的必由之路,势在必行。对此,作为管理和拥有大量产权产籍信息资源的房产档案部门,为更好地适应形势发展的要求,我们着眼未来,运用数字化、信息化技术,对档案数字化进行了有益的实践与探索。

一、档案数字化的意义

1、档案数字化的含义

档案数字化是指利用计算机技术、扫描技术、数字成像技术、数据库技术、多媒体技术、存储技术等高新技术把各种载体的档案资源转化为数字化的档案信息,以数字化的形式存储、网络化的形式互相联结,利用计算机系统进行管理,形成一个有序结构的档案信息库,及时提供利用,实现资源共享,是档案信息化建设的重要内容。目前,大多数档案馆保存的档案信息形态主要以纸质、缩微胶片和底片等载体形式存在,只适应于传统的管理与传播方式,即实施手工管理和以点到点的传播,即便是经过编研等初步加工,编辑印发档案资料,实现以点到面的传播,其覆盖面也还是太小,很难达到社会化程度。档案信息资源的经济价值和社会价值也难以充分实现,更难适应当代“数字化生存”的形势。档案原件数字化,对档案信息的现代化管理、使用和传播等都具有很重要的作用。

2、档案数字化的主要内容

①档案目录信息的数字化,建立档案目录数据库。

②载体档案的数字化,如纸质档案、照片档案及录音录像档案等的数字化,建立档案影像数据库或多媒体数据库。

3、档案数字化的主要作用

①档案数字化是档案信息化建设重要内容。档案信息化建设的核心是资源建设。资源建设包括两大方面任务:一是现有馆藏档案的目录数据库建设和馆藏重要纸质档案和照片、录音、录像档案的数字化;二是现行电子文件归档与电子档案管理。

②档案数字化能有效地保护档案原件。⑴、代替原件使用,保护档案原件。⑵、数字化副本异地保存,输出磁盘、磁带供永久保存。这样可使这些档案资料在出现天灾人祸的情况下不致于遭到毁灭性的破坏。⑶、恢复档案材料模糊褪变的字迹及对污损残缺照片档案的修复。

③档案数字化能改善档案的利用方式。⑴不再受“孤本”的限制,一份文件可以同时提供给所有需要它的人共享。⑵数字影像文件可以通过计算机局域网或者广域网进行异地传输,使异地调阅利用成为可能。扩大了档案的利用空间,让更多的人们来了解档案,利用档案。⑶“时间”不再受限制,利用者可以随时使用自己需要的文件。档案数字化以后,将已开放的档案上网,这样所有利用者就可以在任何时间上网利用档案信息资源。

④档案数字化是传统档案馆走向数字档案馆的必经之路。数字档案馆无疑是21世纪各级各类档案馆的发展方向。尽管当前它的具体组成结构、组织管理模式还处于探索之中,可其“馆藏”的数字化特征是肯定的,传统档案的数字化将是其“馆藏”的重要组成部分。

二、档案数字化的实践

1、档案数字化工作回顾

为了加快实现档案的现代化管理,方便检索和提供利用,我馆多年来花大力气致力于档案信息库建设和档案的数字化工作。1993年,我馆购置微机,独立开发人事档案管理系统,开始档案数字化的工作,使得全局职工基本情况在电脑中一览无遗,工资情况也能被系统所显示。1998年开发文书档案管理软件,利用电脑管理文书档案目录。经过这些年的努力工作,我们将馆藏所有文书档案、人事档案全部录入电脑,并实现了电脑查询,极大方便了档案管理。2002年,我馆与市房地产产权处合并,而产权处在1995年,开发出产权产籍管理软件,房产交易办证实现电脑化办公,并在实践中不断完善程序,将绝大部分产权产籍档案录入电脑,为全市房产发证加快了办事流程,减少了出现错误的几率。

2、实施档案数字化工程的必要性

首先,大力推进国民经济和社会信息化,以信息化带动工业化,实现社会生产力的跨越式发展,是党中央抓住信息化这一机遇,在党的十五届五中全会作出的战略决策。为了适应国家信息化建设和档案事业发展要求,2002年11月25日,国家档案局制定下发了《全国档案信息化建设实施纲要》,指出了“十五”期间档案信息化建设的指导思想、目标与主要任务。

其次,随着城市建设的快速发展,老百姓购房办证数量的激增,为保障尽可能缩短老百姓办理权证时间,不出现发证错误和重复发证,传统管理根本不能满足要求。

最后,2002年10月随着市房地产档案馆与市产权监督管理处的合并,档案管理工作出现了新的局面。湘潭市产权监督管理处开始建设湘潭市首个GIS系统——湘潭市房地产GIS 系统,该系统最基础的工作也是最重要的工作是档案数字化工作(或称档案数据导入工作),只有保证档案数字化才能保障房地产GIS系统的基础的牢靠。

3、档案数字化工程的定位

产权产籍档案数字化工程是湘潭市房产局房地产GIS系统的子项目,旨在将海量产权产籍档案信息化、数字化,实现房地产GIS系统底层数据的全数字化,并通过建立后的系统实现“以图管房”,减少办证错误,提高办证时效,并通过GIS系统数据统计,向各职能管理部门和政府宏观调控部门提供数字化的档案信息及较为精确的统计报告,更好地为城市建设和房地产市场管理服务。

4、档案数字化工程需求分析

需处理量:A、产权档案:馆藏产权档案共计35万多卷。B、房产抵押、担保、司法查封档案:房产抵押档案12900余卷,担保档案2050余卷,司法查封档案1500余卷。C、正常业务:2003年9月1日之后的所有正常业务档案。

处理措施:划分时间线2003年9月1日,区分处理方式。时间线之前的档案将其档案实体整理与装订,各类档案详细录入相关页面数据,档案原件通过数字照相技术扫描;时间线之后的档案,按照新开发的正常办证流程来实现数字化。

5、档案数字化工程的内容

将所有各类档案进行规范整理,然后,分成档案鉴定、档案扫描、档案导入三个大的环节,11个小环节分类录入服务器数据库。不仅仅将档案原件扫描生成图片存储,并将档案原件上记载的55项相关重要业务数据真实、准确的录入数据库。

6、档案数字化工程实施情况

需求分析与设备考察阶段:调查分析馆藏情况,包括档案的类型、载体形态与状态、馆藏数量等基本情况。根据馆藏情况制订档案数字化的科学规划,确定项目需求,根据需求考察当前各种高速扫描系统的集成解决方案。在设备考察阶段我们特别注意这么几个问题:A、档案数字化设备配置计划的成套性。B、档案数字化设备的配套性,也就是文档扫描仪和数字照相机优缺点对比,通过不断的实践,我们觉得数字照相机更加适应我们的工作。C、档案数字化项目硬件与软件的集成性。D、档案数字化方案与我馆需求的适应性。总之,考虑到档案信息数字化要经过一个较长的过程,因此我们从实际需要和长远打算出发,力求确保电脑、照相机、操作人员等设施人员数量的成龙配套,使其具有较强的支撑能力和扩展能力。

系统实验阶段:2002年底,项目开始立项。组织业务、技术骨干远赴深圳、上海、黑龙江佳木斯市等地实践考察,2003年6月,正式成立房地产GIS系统领导小组、数据导入小组,调集相关业务、技术精英加入团队,正式开始实验阶段的工作,新购进了12台电脑微机,4台佳能数码相机,4台EPSON激光打印机,一台工作站服务器,设备安装调试完毕。通过前期和软件公司合作,共同开发我们所需要的软件。探索档案数字化工作在快速系统下,档案前期整理、档案扫描、质量检查、扫描文件管理、后期整理等全过程的协调配合问题,并探讨在高速系统下如何解决某些技术问题。经过近一年的测试,我们对整体系统流程和配套软件、数据库的性能有更进一步的了解,在项目的运作模式和系统管理等方面积累了一定的经验,同时,也锻炼了一支技术过硬的队伍,为系统的正式运行打下了基础。

项目实施阶段:本项目是一个长期、流程化运作的系统,从建立开始就必须确保能长期高速、稳定运行。在系统的开发与研究方面有一个时间周期,现把工作计划分为以下几个阶段:

①、系统总体方案框架设计:

2002年12月—2003年6月,完成系统总体框架,生成详细可行性分析报告,及相关配套业务标准、各类管理制度。

②、系统建立:

2003年6月—2003年10月,系统建立,包括:硬件配置及软件的开发。

③、系统试运行:

2003年10月—2004年2月。

④、系统正式运行:

2004年2月起,系统正式运行,同学校签订合作框架协议,调集员工和学生共100多人,经过一段时间的业务及技能培训,参与系统的正式运行,在运行中不断完善升级。

三、对档案数字化的思考

1、提高认识,统筹规划

首先必须在思想上充分认识档案信息资源的重要意义,在当今信息公开程度越来越高的形势下,档案的文化性质和社会性质逐步强化,利用的范围和对象将逐步扩大。在这个信息时代,只有当档案信息资源在社会主义现代化建设中发挥重要作用时,档案和档案工作的意义和价值才能充分地全面地展现出来。

其次,作好统筹规划。将大量的档案数字化,是一个庞大的系统工程。首先要做好馆藏情况的调查,包括档案的类型、载体形态与状态、馆藏数量、档案信息利用等基本情况。根据馆藏情况制订档案数字化的科学规划,包括服务器、电脑、扫描设备等硬件的购置计划和数字化处理规划。档案数字化实施处理规划应贯彻“突出重点,分步进行”的原则,对馆藏重点和利用率高的档案先行数字化,早日满足大多数利用者的需求。

最后,档案数字化是一项费时较长的工程,在大规模、流程化的数字化过程中,所有档案原件都需从档案库房分批大量取出,一定要保障档案原件的完整,不允许出现损毁和遗失的现象。

2、加强基础工作,认真做好档案数字化

①、档案数字化必须有所选择。针对馆藏“浩瀚”的档案资源,不加选择地全部数字化是不可能的、也是不必要的。我们应该根据一定的原则确定哪些馆藏档案原件应该数字化、哪些档案原件中哪些页不需要数字化。

②、做好数字化时扫描参数的优化设置。扫描系统扫描参数的选择和确定对扫描数字影像质量有着较大影响,其中扫描分辨率直接关系到扫描文件的清晰度和还原效果。我们在选择分辨率时应根据实际需要综合考虑,包括扫描文件的可阅读性、存储空间、输出打印质量等。

③、做好档案数字化的全程控制。在档案数字化过程中,要注重全面的质量检查,加强数据的质量控制。质量检查应包括以下几方面内容:A、数字化前的档案整理检查。要进行数字化的档案原件必须完整、排序正确,对折损严重影响扫描质量的原件应预先修整。B、

数字化中的人员业务培训。数字化工作是需要人来完成的,人员业务培训不过关,直接导致返工,间接导致成本的增加,时间段的延长。C、数字化后的数据质量、图像质量检查。录入后的档案信息要做到非常高的正确率,扫描后的文件图像应保持档案的原貌,字迹清楚不失真,无错扫、漏扫,对文件图像质量有问题的应重新扫描。

3、开展档案数字化问题的研究,及时解决数字化进程中的疑难问题。

档案数字化是档案工作中的一项新内容,不可避免地会遇到一些新情况、新问题。比如,数字化档案信息压缩及存储的关键技术问题;业务形态于现有技术手段相抵触;数字化档案信息安全、保密技术问题;数字化档案信息的访问形式与安全控制问题;数字化档案信息知识产权问题;数字化档案信息的法律地位问题。针对这些新情况、新问题,应在抓档案原件数字化工作的同时,组织力量开展档案数字化问题的研究,及时解决工作中的一些业务问题和相关技术性问题,同时澄清和统一思想认识,确保档案数字化工作的顺利开展。

另外,必须加强档案数字化和数字化档案信息管理人才的培养。只懂得计算机技术或只懂得纸质等载体档案管理知识的人无法胜任此项工作,所以应加强这方面技术人员的培养。

第16届国际档案大会刚刚闭幕,此次会议的主题是:“档案、管理与发展:描述未来社会”。我们应不断学习最先进的档案管理模式,不断走出去看看,开拓眼界,才能跟上时代发展的主旋律。

国土房管档案馆档案影像管理系统

一、需求分析

----国土房管档案影像管理系统,其核心是完成纸面档案的影像化管理工作,将传统的纸面文档管理转变为对影像文档的管理,将传统的对纸面文档的数据索引方式转变为面对影像文档进行索引的方式,从而为业务的开展提供足够的、快速的信息保障,进而为提高工作效率打下坚实基础。

----系统要求:分别成立专职的扫描工作点、索引工作点、查询工作点。扫描工作点主要进行集中的扫描工作,开展索引前纸面文件的预处理;索引工作点主要完成索引数据的录入,数据入库、生成相关业务报表、建立影像文档库等工作;查询工作点可以是本单位内局域网上的任意多个工作站。

----以下对已掌握的需求要点分别进行分析,以及提出解决建议:

1、档案科目分类

需求:档案业务单式种类较多、分类查询方式也较多样

系统要求:软件在分类、录入上应当实现简便、快捷。

2、档案规格、尺寸

需求:虽然档案的尺寸、规格基本相同,但考虑到可能要涉及到的附件纸张规格有不同规格和纸张质量(薄厚),这对扫描仪应当有着较高的要求。

系统要求:采用能够实现多种规格尺寸的档案、档案可以实现同时扫描的设备,不必对规格、尺寸做任何限制和要求。

3、档案处理手续

在处理电子文档过程中,所有的档案都要按照类别、顺序号排列,但是如有缺漏要立即发验,

保证文档的完整。原始档案和影印件要准确无误的保存起来。

系统要求:系统工作流程定义时,避免流程的逆转,要求图像扫描和处理时要准确无误,不能存在纠偏变形、遗失档案和要素等问题。

4、档案、档案要素

需求:档案的数量和格式不具有绝对固定性,不定期的会增加一些档案,档案的格式也存在变更的可能性。

系统要求:软件可根据档案数量、种类和要素的变化,可以自定义档案和要素。

5、档案纸张

需求:档案的纸张的质量差别虽然不是很大,但要保证原始档案的完整性;另外,有的手写体和印刷体字迹不很清晰。

系统要求:不能撕坏纸张;必须能够对字迹进行增强;扫描是能够自动识别纸张的薄厚,对于一部分年久的纸面文档,应采用平板扫描的方式进行处理。

6、档案的信息处理:

系统要求:历史档案处理,需要采用两台高端的扫描仪、2台中端自动进纸扫描仪,5台平板扫描,多台数码照相机,扫描时需人手做前期整理工作,以及后期的档案归档工作。

完成所有的历史档案的处理需要准备不低于1.3T的存贮空间。

7、扫描方式

需求:档案的扫描不进行分散扫描,分散扫描会造成各口工作人员的工作效率的极大下降,并且扫描后的文档较为混乱,不利于后续的索引工作。

系统要求:在减少硬件投入的情况下,有利于提高工作效率,减少扫描的工作环节和更有效地进行质量控制,扫描之前应对被扫描的档案进行归类整理,以方便扫描,扫描过后由QA 进行质量检查。

8、正确索引

需求:要求写入数据库的索引数据要确保正确。

系统要求:为了确保索引相关信息被正确入库,可灵活采用一次录入,二次较对,或操作人员两次录入的工作方式,系统自动校对。

9、影像文档及数据安全

需求:档案管理部门所涉及的档案,对安全性及其保密性有很高的要求。

系统要求:可对影像化的档案资料进行加密。

10、影像文档的查询

需求:按一定的权限要求进行系统设置,完成查询的需求。

系统要求:采用安装客户端的方式,按一定的权限要求进行系统设置,完成查询的需求。11、备份归档

需求:国土房管档案影像管理系统要求提供可靠的数据存储与备份。

系统要求:按现有的数据量以及计划中的投资,可以采取大容量存储设备磁盘阵列和磁带机作近线备份的方式保存数据。

12、查询响应速度

需求:系统查询速度需要考虑多用户、多数据时系统要能达到较佳的响应速度。

系统要求:影响系统查询速度的因素主要有三个:网络带宽、影像文件大小及并发用户的数量。所以影像文件的调阅速度基本上由周边网络设备设决定。

二、解决方案

1、目标

----国土房管档案影像管理系统担负着档案的管理的任务,是一个专职处理档案的职能部门,通过为国土房管档案影像管理系统建立档案影像管理系统,引入新一代的文件管理技术,为

国土房管档案影像管理系统建立原始档案的影像档案库,以达到加强原始档案的管理、提高管理效率、降低管理成本、实现资料的快速查询及共享的目的。

2、概述

----信息行业作为知识经济时代的核心产业之一,近年来一直以惊人的速度在不断发展,而以纸面文件作为媒介的各种信息资料也呈爆炸性增长。如何有效管理这些信息资料,不断提高信息的使用效率,已经成为一个重要课题。

3、现状

----国土房管档案影像管理系统的在日常业务中,会产生大量档案,档案多以纸面文档的方式产生,以传统的数据处理方式进行处理,纸面档案每天都在大量地产生,再加上历史遗留文档,数量是非常惊人的,其中所涉及的信息数量也非常庞大。对于这些档案及信息,如何进行分类、保存和归档,录入、高效的查询,一直是一件非常棘手的事情。在传统模式下,总是被以下几个难题所困扰:

●检索、查询和日常管理麻烦,工作效率不高;

●纸面文档不好保存,很容易被损坏或弄污;

●管理效率低下,管理成本居高不下;

●档案调阅及信息利用效率较低;

●工作低效率、高成本;

----从以上的介绍,不难看仅仅用手工进行纸面档案的管理有很大局限性,在信息技术飞速发展的今天,也越来越不合时宜了。如何利用最新科技,完成纸面档案的电子化管理工作已经成为当务之急。

4、影像技术简介

电子影像是指各类文档的电子照片。

----影像技术是指将各种文档制作成电子照片,使这些文档的采集、分发、使用、管理、存储完全电子化的相关技术,而传统的电子化技术是把文档上的信息制作成电子数据,把文档的流转和处理转化为数据的流转和处理。

----影像系统是指对经影像化处理的文档完成数据录入、查询、调阅、批改、存储等功能的一整套解决方案,通过方案的实施能有效的解决传统手工纸面文档管理所无法解决的难题,具体有以下几方面:

●原始文档电子影像化备份;

●可靠安全的数据管理;

●文档“影像原件”的高效查询;

●在减少工作难度的同时,进一步推进管理工作的规范化。

----文档影像化作为一种先进的信息管理手段,一经采用,必将大大提高纸面文档及数据的管理效率,降低成本,改进服务,提高信息利用率。

影像技术应用的可以分不同阶段开展

●初级阶段:影像化存档:

完成文档影像化工作及影像文件查询

不涉及工作流技术

不涉及业务过程

●深化阶段:影像化业务处理:

工作流技术与影像技术结合

融入业务处理过程

从后台走向前台

三、详细的技术方案设计

1、工作流程设计

注:当有以下情况发生时,工作流程按以下的规定进行:

A.扫描QA时发现漏扫、误扫、扫描质量太差:重新扫描。

B.索引时发现漏扫、误扫、扫描质量太差:重新扫描。

C.自动校对时发现有误:取有误的输入数据对照文件重新修改,计入日志,生成相应报表。

接收档案

对所接收的纸质文件,根据一定的规则按类别、按份数完成文档的第一次整理工作。

确立批次

以加入标识纸的方式,对每一份档案进行分隔;以一定的份数为一批,系统将自动生成批次号(注:也可以采用条码自动识别的方式进行分页及生成流水号,但采用条码方式需要加大软、硬件的投入。)

2、扫描

中高速扫描

系统采用PANASONIC 高速扫描仪KV-SS905CCN 2台、中速扫描仪KV-S7065CCN 2台,以每个批次为单位,放入扫描仪的自动进纸进行扫描。扫描时,自动生成档案的分类、分页。

3、影像处理

扫描质检

检查扫描的电子影像文件是否有漏扫、误扫和扫描质量欠佳等,以保证扫描输出高质量的电子影像文件。

进行扫描质检时可以采取扫描完后,在扫描工作站上进行扫描的电子影像文件进行质检。扫描补漏

对于有质量问题的影像文件建议全批重扫以减少操作复杂性,个别情况下可以用平板扫描仪、数码照相机对那些漏扫、误扫和扫描质量欠佳的文件进行追加扫描。

4、原始档案装订入库

在对扫描后的电子影像文件检查无误,将原始档案采用常用的档案管理方式装订及入库。5、索引

在索引时可采用一人两次录入,系统自动较对,对系统较对不一致的数据,进行校验及录入。

6、数据归档

接收数据及相应的报表,数据分别供业务数据库使用及影像文档库使用。

7、归档备份

本系统采用一台服务器、一个专用磁盘阵列对索引文件、影像文件进行备份;在进行索引文件备份可以采用定时备份或定容量备份,还可以采用不定时备份,这样影像文件服务器遭到灾难性破坏,可以直接将所备份的索引文件恢复。

8、检索、查询、管理影像文件

在对影像文件进行查询时,基于本系统的在局域网里的查询,采用安装工作站软件的方式,生成查询日志。

5系统结构及配置

四、系统结构

系统结构如下图所示:

系统功能

我们设计的解决方案,由以下几个子系统功能组成:

高速扫描

由高速扫描软件提供高速扫描图像资料的功能,把客户的原始资料转换为电子影像资料。由高速扫描员使用。把保存的数据送到质量检验工序。

质量检验及数据录入

影像质量检验与部分索引录入是把影像质量有问题和数据不正确的影像资料找出来,由质检员使用。索引的资料将会分别放在影像库中及数据库之中。

系统管理

本系统提供的维护和生产情况查询功能,由系统管理员使用。

安全管理

本系统分系统管理员、高速扫描员、质检员和查询客户。其中系统管理员负责整个系统的管理,拥有系统的所有权限。高速扫描员、质检员有相对应的工序使用权。而查询客户只拥有

影像资料的查询权。

生产日志查询

可统计和查询在各工序间的未处理资料情况;

可统计和查询资料保存到影像数据库的情况。

出错处理

如果在使用过程中发现索引信息有误,系统管理员可以删除错误纪录,调出相应存放地中的资料重新扫描并建立索引。

影像查询

本系统提供资料影像查询功能,使业务人员可以通过EZDOC影像管理系统随时查找需要的影像数据,查询相应的影像文件;影像文件在查看时可以有放大、缩小、旋转、打印的功能;记录查询日志。

校验功能

系统可以与其它系统的有机联接,可以自动与业务系统提供之数据进行对比。

数据备份

数据备份分为两个部分:影像文件索引信息数据库备份、影像文件备份。

对于影像文件索引信息数据库的备份,电子档案管理系统不再另外提供备份功能,而是直接使用数据库管理系统的备份、恢复功能,保证数据库的完整性、有效性、可恢复性。

有关影像文件的备份:电子档案影像索引之后,首先存储于影像文件服务器,然后,系统自动完成备分机的备份任务。

5.3.2系统特点

无业务流程的逆转

国土房管档案影像管理系统要求:“准确”、“迅速”、“安全”、“方便”。自然,在业务流程中尽可能避免业务流程逆转,也就是说:在影像扫描的过程中尽可能避免档案重新扫描、档案漏扫等问题。流程的逆转会增加数据错误的可能,流程逆转的环节越多错误可能性越大。用户可以自定义档案分类

档案种类繁杂,而且档案种类、档案要素并不固定,而且可能发生变化,如果系统将档案类别做成固定方式,则无法适合业务的发展。于是,我们在系统中为用户提供了一个开放式接口,可以让客户按照自己的方式增加、修改一些档案分类和档案要素。——不用编程,全部通过鼠标即可完成。

用户可选择当前扫描、输入的文档类型

虽然,每天处理的档案的种类和数量较大,但并不是每种档案都有——通常数量大的主要分布在大业务上,有些档案通常几天出现一次。如果每天都要建立所有的分类,这将消耗不必要的存储空间。因此,我们提供了对当前要扫描档案类别的选择功能,客户可以根据当前业务情况进行选择。

用户可以自己确定档案的要素

据上所述,我们的档案类别差异很大,而且不定期在发生着变化,那么,档案的数据要素也在发生着变化,为了让客户更好的适应这种变化,我们提供一个开放式档案要素设定。可以根据具体的档案设置、更改某些要素。

多种安全保护模式

软件登录是采用密码方式。

数据库系统及影像文件也做了加密工作,防止他人修改影像数据和数据库数据。

质量控制

在扫描过程中若出现漏扫、误扫或影像质量不好的问题,通过有效的工作日志的管理,解决以上问题。

档案数字化方案研究

课题组

《档案数字化方案研究》项目对档案数字化优化策略与原则、技术路线与支持、流程重组与再造、操作方法与步骤进行了全面的研究,达到了档案数字化全过程优化和管理系统整体优化的目的,形成了完整的档案数字化方案和成功的实践案例。国家档案局组织的专家鉴定委员会结论是:“该项目基于长春市档案馆以档案利用为导向、渐进性的档案数字化实践,提出了档案数字化工作的指导思想、优化原则和优化策略,符合国情,符合现代管理理念,对全国各档案馆的相关工作具有较大的参考价值;注重档案数字化工作与档案数据库建设、档案信息网络开发的有机衔接,提出了系统优化的技术路线,规划设计了档案鉴定与数字化同步、档案数字化与上网利用同步、多种档案数据库建设同步的流程,并成功地付诸实践,实现了档案数字化与上网利用的低成本、高效率、高效益。同时,运用CA认证、数字水印、电子签章等技术,为网上档案信息资源安全、准确利用提供了技术保证,也为档案管理部门提供了很好的实践模式”。该项目获国家档案局2006年优秀科技成果二等奖的同时,长春市档案馆被国务院信息化工作办公室和国家档案局确定为传统载体档案数字化试点单位。一.档案数字化的指导思想

以优化理论为指导,以用户需求为导向,以利用档案为目的,充分应用计算机软硬件功能,最大限度地发挥人力资源和数字化加工设备能力,兼顾保护档案原件的要求,保证数字化档案的真实可靠,更好地发挥档案信息资源的作用。

二、档案数字化的优化原则

实用性原则:针对馆藏档案具备重复利用和紧急利用两大特点,急用、常用档案优先数字化是档案数字化的首选。

开放性原则:互联网给档案信息资源共享提供了超越时空的条件,国家民主政治建设和政府信息公开催促档案解密和开放,开放档案及时数字化是实现其社会共享的前提。

价值性原则:重要档案优先数字化具有档案利用和档案保护双重意义,是网络时代更好实现档案价值的客观需要。

抢救性原则:计算机存储给档案抢救开辟了了新的途径,档案数字化是保护濒危档案原件最经济和便捷的方法。

时效性原则:档案数字化加工与数字化档案利用同步实现,是充分利用计算机网络技术,更好、更快地实现档案数字化效益的最佳途径。

三、档案数字化的优化策略

需求导向策略:社会需求是制定和调整档案数字化工作策略的“风向标”。汇集多年档案利用情况统计,把利用频繁档案的进行综合分析,科学地圈定优先档案数字化的范围。并建立快速反应机制,执行常用档案继续做与急用档案突击做的计划,达到数字化档案利用即时见效的目的。

本级为主策略:地方档案馆保存的本级永久档案是数字化的重点。进入信息时代,馆际间重复的上级档案文件,与其分头进行数字化及开放鉴定,不如发挥中国特色档案管理体制的优势,由上级档案行政管理部门组织,向馆际共建、共享数字化、开放鉴定成果的方向发展,尽量减少档案馆多层的重复劳动。

分步实施策略:馆藏档案数字化不可能一步到位,而且随着时间的推移,档案室进馆范围的档案将陆续移交到档案馆,这些档案采取馆室共建、共赢、共享的数字化策略非常有意义。剔除无用策略:馆藏现行档案是否进馆往往由立卷人员决定,加之保管期限表比较笼统,馆

藏不该归档、不该进馆、重复档案颇多。特别是建国超过50年以后,市以下档案馆长期保管的档案逐年超过保管期的上限。因此,开展档案价值鉴定,剔除无用,以免再造数字化垃圾,避免资源浪费应是长久的策略。

四、技术路线的优化选择

档案鉴定与数字化同步:从利用上讲,解决制约档案信息资源共享的主要瓶颈---档案开放鉴定问题是当务之急;从成本上讲,档案价值鉴定是避免失效档案数字化的最佳方法。只有这样,才能控制档案数字化投入与产出比例失调、数量很大共享很少的问题。

多种档案数据库建设同步:一是首先建立文件级目录数据库。满足一次检索需要,建好文件级目录数据库。目前,绝大多数档案馆,因没实现全部档案的文件级目录机检,查档不快、不准、不全的问题不可避免。所以,把文件级目录数据库建设作为基础性工作,是提高档案查全率、查准率必经之路。二是适时建立专题数据库。随着社会发展,对某一专题档案集中需求时有发生,突击建立专题数据库,满足社会需求是发挥档案作用的最佳时机。三是优选建设全文数据库。满足档案信息资源开发利用需要,优选建设全文数据库。按照国家档案局提出的利用频繁档案首先数字化的要求,遵循“二八”定律(即以20%的努力达到80%的效果),同步开展档案全文数据库建设。

档案数字化与上网利用同步:档案数字化的根本目的是充分发挥其作用。通过计算机网络技术,实现档案数字化与局域网上利用同步,开放档案数字化与互联网上利用同步。

五.重组和再造的优化流程

为发挥计算机网络的优势,重组和再造优化流程的实质,就是对档案数字化整个工作流程进行系统分析,不但要打破原有业务规程,还要改变行政管理分工,进行全方位的变革。档案数字化的任何一个细节都会对整体产生影响,轻者降低效率,重者决定成败。长春市档案馆高度重视每一个细节,再造和优化了上百个流程和内部标准,保证优化技术路线的顺利执行。六.档案数字化示范案例----长春模式

从2004年开始,长春市档案馆以科研课题为先导,以项目管理为手段,以效益实现为检验标准,组建并成功运行档案数字化工作组织架构、资源配置、数字化加工、上网利用“一站式”流水作业线,探索档案数字化和网上利用服务工程优化模式,终于闯出一条独特的档案数字化之路。

(一)实施三个工程,建立一个团队

长春市档案馆把信息化带动作为首位战略,视为一把手工程、班子工程、全员工程突出抓,并创新管理机制,打破行政分工,在计算机网络环境下,建立了行政领导、指导专家(技术业务总负责)、专业人员、外聘技工20人的长期流程团队,并与现有计算机和扫描设备进行合理搭配。该团队由局(馆)党组直接领导,馆技术部门提供支持,管理部门提供档案,专家提供指导,创立了高效的组织体系,搭建了投入小产出大机制框架。

(二)集中四个环节,坚持流水作业

文件级目录数据录入是档案数字化的基础,档案鉴定是档案信息资源共享的前提,全文数字化是提升档案服务水平的途径,整理是档案文件实体管理主要环节,把上述四个环节集中,是提高工作效率和质量的最佳选择。长春市档案馆四集中流水线上,目录数据录入岗位安排业务和技工7名、档案鉴定岗位安排5人、档案数字化加工4人、档案实体整理4人,在网络环境下实行集中办公和流水作业。

(三)数字化成本降低,数字化速度加快

由于采用高效的组织体系和优化的技术路线,已有20万件档案走下流水线。

低成本主要体现在:20万件档案缓销剔出占24.7%,留存档案占75.3%;留存的75.3%档案,全文数字化占25.6%,现用现扫占49.7%,比全部扫描节省费用40%以上。同时,三年时间建成数据库50个,文件级数据库120万条(包括20万件全文);专题数据库120万条;照

片数据库2000张;资料数据库5000条,案卷级目录数据库23万条;现行文件和政府公开信息1万余件(条)。局域网运行档案目录数据260万余条,20万件全文;互联网运行档案目录数据120万条,8万件全文。完成这样规模的数据库建设,全部人工费只有58.4万元(包括流程团队档案干部的工资),经济成本很低,时间成本很少。

高效率主要体现在:价值鉴定、开放鉴定、数字化筛选、原件扫描、实体整理同步完成,比各项分步做效率高数倍,同时有现用现扫的方法配套,投入少量设备,相当于将20万件(200万页)档案全部扫描的效果。

(四)利用方式变革,社会效益显著

为充分发挥网络优势,长春市档案馆采取了直接与间接相结合的方法提供利用。

1、直接提供利用:对数字化档案全文,在局域网内,接待人员利用网络检索后直接打印,为用户提供数字化档案打印件。在互联网上提供数字化档案全文下载、打印服务。并通过CA认证、电子签名等安全技术,对特定的用户直接提供加盖电子签章的数字化档案打印件,已有案例。

2.间接提供利用:对目录数字化档案,在局域网内,接待人员机检到档案后通知档案库管人员,档案库管人员调出原件全文扫描后,通过网络打印机直接传输打印件,由接待人员提供给用户。

目前,长春市档案馆基本实现了三个替代:网络检索替代手工目录检索,查看数字化档案替代查看纸质档案,网络打印替代手工复印。

高效益体现在:档案全文数字化占馆藏档案的10%,提供数字化档案占利用率的70%。为上万人提供了档案证明,公众成为档案数字化的最大受益者。档案数字化成果得到社会公众,上级档案和信息化部门,当地党委、政府,国内外同行的普遍赞誉,数以百计的留言、锦旗、感谢信、奖励证书、媒体报道就是最好的证明。

档案数字化解决方案

档案数字化是指采用扫描仪或数码相机等数码设备对纸质档案进行数字加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。公司装备多种扫描设备:高速扫描仪、零边距扫描仪、宽幅扫描仪、书刊扫描仪,可处理各类纸质文档。可根据不同文档的材质、幅面大小及内容,提供不同的电子化扫描及索引(著录)解决方案,并可根据客户需求量身制定扫描加工方案。

经验丰富的实施生产队伍

自2002年开展数字化扫描加工业务以来,掌握了较全面的专业知识及积累了丰富的工作经验。

成熟的管理机制、有效的管理控制手段。

严谨的质量控制手段,可实现扫描加工过程中各个环节的质量控制和自动化的量化记录,可确保扫描加工的影像、索引的正确性。

严格的客户财产保全制度及控制手段。可确保客户文档资料、数据在扫描加工服务中的安全性、保密性。

先进、灵活的扫描加工生产系统

公司自主研发的扫描加工生产软件系统,基于工作流的任务机制,实现流水线式的生产模式,可根据客户的需求灵活的配置、调整,以适应不同客户、不同类型文档的加工任务。包括:文件、档案、文献、资料、报纸、书刊、杂志、合钉本、汇编

扫描模式:黑白二值、灰度、彩色

扫描分辨率:150DPI~2400 DPI

保存格式:TIFF、JPG、CEB、PDF等。

扫描加工生产软件系统针对文件、档案管理工作的特点,通过集合图像处理、OCR等多项自动化智能技术,实现处理扫描图像自动纠偏、除黑边、去污等处理,实现扫描文件自动命名与装订,生成多页TIF文件,通过OCR识别技术实现电子文件元数据半自动获取,在大幅度提高扫描加工的工作效率的同时,可以完成电子文件元数据的获取工作,并在保证扫描图像文件质量前提下,以最低的容量存储文件。

主要功能介绍

①自动扫描与目录图象属性加工设置;

②自动倾斜校正/去黑边/去白页/加粗/A3切割为A4;

③前置处理设置:去斑、亮度/对比度、颜色通道设置;

④自动文件命名;

⑤自动装订(将多个单页TIF文件合并为1个多页TIF文件),支持固定页分割、白页分割、标志按钮分割;

⑥自动JPG输出质量设置;

⑦自动扫描页计数(见主界面扫描计数器),目录中文件与页数自动统计。

根据各档案馆(室)在处理历史档案问题的经验,结合我公司图像处理技术上的优势,特提出了档案数字化制作流程及相应的技术参考。

1、档案分类整理

档案分类整理是指将案卷按扫描要求进行分解整理,包括原件的拆卷、起钉、粘贴页撕开。并按扫描后的电子文件组织形成进行分类,以便扫描时的批次处理。

2、档案交接

分类整理后的档案按时间先后或其他分类项顺序提出,并按实际卷(页)数填写详细的档案交接清单,并由双方管理人员签字。

3、标引著录

标引著录为了方便查阅与管理,打印制作档案目录及档案封面,对文字录入的准确性要求较高,但著录的文本域并不是完全统一的在某一页面上,一些文本域要在多个文件中选择,所以录入时需要相关档案管理人员进行指导,制作相应的《文字录入工作说明书》,确保文本域录入的准确率。

4、档案的扫描

原件的扫描与存储格式完全按照国家档案管理的统一标准要求扫描。扫描图像使用先进的图像扫描处理软件,扫描人员可根据原稿质量,对系统进行定义,如倾斜校正、去污等批处理功能。在由系统自动处理功能的同时,扫描人员根据原件的实际情况做相应的调整,如超大页面的处理、纸张颜色深浅及薄厚的处理、扫描时可根据不同原件的情况,调整图像的分辨率、明暗度以及扫描方式和扫描速度,确保在扫描图像质量清晰的情况下,使原件完好无损。图像的分辨率正常情况下为150dpi ,如遇字间距和行间距过密、原件本身是复印件等字迹不清楚的情况,可适当增加扫描的分辨率,但要保证图像清晰的同时,又不影响远程查询和浏览的速度。

5、图像处理

档案数字化制作模块中的图像处理采用自动化处理和人工处理相结合的方式,确保图像质量的完美。通过对图像进行校对,确保图像顺序正确,在校对时,发现不合格图像及时返回前一工序进行改正。

1)污渍、黑白、偏斜处理

2)全文字面的扫描密度

3)粘帖页与表格

4)插页

5)照片页的处理

6)存储格式与面页空间

分辨率:100-300dpi

图像格式:TIF、JPG、PDF、CEB

储存空间:A4,黑白二值,40-50KB/页

6、质量检验

对扫描处理完成后的图像页进行检验,对档案拆分、扫描、修正、去污、插图、照片的处理以及文本和图像页的匹配等质量进行全面检验。对文本域录入与文本录入域的标引、文件的页号及页数进行对比,对扫描前图像页的标引与扫描后的图像页的编号与页数进行对比,发现不合格的登记清单并退回上一流程重新处理。

7、挂接

文本域录入和扫描处理检验后的图像成品,由系统自动进行文字图像与系统的匹配挂接。挂接到档案数据库系统中后,进行再次的成品验收。

8、案卷整理

档案整理工作严格按照国家档案局规定的相关标准和本单位实际情况进行有序的整理,安排专人负责案卷合并与整理。

9、入库交接

装订还原后的档案按时间先后或其他分类项顺序入库,并按实际卷(页)数填写详细的档案交接清单,并由双方管理人员签字。

档案资料是历史的见证、社会的财富,无论在国内还是国外都对其价值与重要性给予了高度的重视。但是,由于传统的档案保存方式一直采用纸张保存和目录式管理,不仅占用了大量库房空间,管理成本高,保管时易损坏,如纸张易黄、易粘、易脆,而且查阅、利用非常不便;虽然目前有部分单位使用计算机管理,但其多数是基于目录级的管理,文档资料本身仍以纸张形式存在,其管理、查询与利用仍需要在库房中进行,因此并没有解决传统纯粹纸张化文档资料管理所固有的成本高、效率低、原件容易损毁等问题。

如何安全、有效地管理日益庞大的档案信息并能满足快速查询的需求?建立一套完整的、自动化的、扩展性强的文档信息管理系统已势在必行。

一、目前现状

1.传统的档案数据库中分类信息复杂,需靠手工查询纸张原件,响应速度慢。

2.由于档案量巨大,当需要查询档案时,需花费几个小时甚至一天的时间在档案室查找。耗时、耗力。

3.由于档案需长期保存,为提高存储环境,避免可能造成文档纸张受潮、虫蚀以及火灾等灾害,每年大量投入文档的保管经费已在所难免,且因无备份而又为每年不得不有的文档损失担忧。

4.由于档案需反复查阅,不可避免的存在原件受损或遗失,给文档的保管与利用带来管理上的困扰。

5.在已认知的低档平板扫描仪录入的方式下,大量文档的电子化进程是不可想象和解决的,且大量电子化文档如何管理、查阅、应用有待全面解决。

二、解决方案

高速文档扫描仪:富士通扫描仪

E-DOCscan 文档自动扫描软件

MaxAttach NAS 4000存储器

服务器:自选

数据库:SQL或Oracle 大型数据库软件

软件:数字化档案管理软件

操作系统:服务器端Windows2000Server+IIS5.0 以上

客户端Windows9X+IE5.0 以上

其它设备:打印机、条码打印机等

档案数字化方案制定与实施

长春市档案局梁伟李学广

馆藏传统载体档案数字化的问题,许多地方档案馆进行了实践,积累了一定的经验,对全国档案数字化建设起到了推动作用。但是,总结以前我国档案数字化建设的不足和失误,往往不是信息技术支持不够,而是绝大多数都知道搞数字化,但档案数字化目的是利用的主题不突出,忽略档案开放鉴定与数字化档案利用的逻辑关系,对先剔除无用档案后开展数字化的思路不明确,没很好研究档案数字化的整体效果就大张旗鼓地做起来了。进而出现数字化目录数据和全文数据不对应、找不着或不好用等问题不少,档案数字化的量虽多,但能上网利用或者说能上互联网利用的很少,数字化返工的现象比较突出,使有限的资金投入并没有体现在数字化档案的利用效益上,这一点已引起档案系统管理和技术高层领导的重视,许多实践工作者已开始进行有益的探索。

面对网络时代公众迫切需要远程、公开、快捷的档案信息,面对馆藏浩瀚如海的案卷,面对当前我国档案数字化需要解决的一系列问题,长春市档案馆与中国人民大学信息资源管理学院共同承担了国家档案局科技项目《档案数字化方案研究》。该项目经过课题研究人员的共同努力,已取得初步研究成果。通过课题研究,对档案数字化方案的研究提出了一些观点和看法,大家交流和讨论。

一、确定档案数字化指导思想与原则

档案数字化指导思想是:以需求为导向,以利用为目的,充分利用计算机软硬件功能,最大限度发挥人力资源和数字化加工设备能力,保护馆藏档案原件完好,保证数字化档案真实准确,更好地发挥档案信息资源的作用。

档案数字化原则是:遵循重要档案数字化的价值性原则、常用档案数字化的实用性原则、开放档案数字化的开放性原则、褪迹档案数字化的抢救性原则,解密档案数字化的及时性原则,目录数字化与全文数字化分步的时效性原则,档案数字化加工与利用同步的一致性原则。

二、明确档案数字化策略

(一)需求导向,急用先上策略

1.需求导向策略

社会需求对档案利用的影响应该是档案工作者特别关注的问题。我们用统计数字加以分析。

(1)随着编史修志工作纳入各地工作规划,1986年全国省(区、市)综合档案馆接待编史修志查档卷数占利用总卷数的69%。随着编史修志阶段性高潮过去,2003年全国省(区、市)综合档案馆接待编史修志查档卷数占利用总卷数的28%。下降41个百分点。(此数据来自国家档案局法规司保存的档案统计年)

(2)随着社会保障制度的建立和国有企业改革的深入,长春市档案馆查阅工人调配档案卷数占利用总卷数的百分比,由2002年的1%增加到2004年的占利用总卷数的68%。(此数据来自长春市档案馆利用统计数据库)

由此看出,国家、地方新政策的出台和工作部署对档案利用的影响程度。从宏观上讲,档案利用已实现了两个转变,服务重点由政治领域转变为经济领域,服务对象由机关干部扩展到公众百姓,特别是为百姓提供凭证案例急剧上升。用动态观念研究当前与长远社会对档案的需求,并指导档案数字化与利用服务工程实践应该是档案部门的必然选择。

2.急用先上策略

地方档案馆馆藏档案数量众多。但并不是所有档案都在现实中利用,有相当大一部分多年不用。2004年全国省(区、市)综合档案馆档案平均利用率仅为1.6%。虽然档案馆众多全宗中当地党委、政府全宗利用率高是一般规律,但其他全宗利用情况往往和政策、时间的变化而变化,影响更大。所以,各级地方档案馆按照近期利用统计情况和发展趋势确定数字化的先后顺序是科学的选择,利用优化理论进行档案数字化筛选,快速反应,突击完成急用档案数字化任务,能够达到更好地发挥档案作用的目的,实现即时投入使用的预期。(此数据来自国家档案局法规司保存的档案统计年报)

(二)本级为主,分步实施策略

(1)本级为主策略

根据档案馆职能分工和档案来源原则,各级地方档案馆永久档案绝大多数是本级机关形成的,一般都占50%以上,这部分档案自然是当地档案馆数字化的重点。同时,地方档案馆都保管着大量的上级档案文件,馆际之间上级档案文件重复是必要的,这些纸质文件来源一般都是上级机关统一印制的。进入信息时代,地方档案馆都面临着保管的上级档案文件全文数字化问题,特别是上级档案文件的开放鉴定审查问题,与其各地分头审查上级档案文件开放和进行数字化,不如国家档案局着手进行档案全文数字化和开放鉴定分工、协作,向馆际共建、共享已有鉴定和数字化成果的方向发展。地方档案馆坚持本级为主的原则,根据需要和可能适时、适量地进行利用频繁政策性上级档案文件的全文数字化,以满足当前工作的急需,尽量减少档案馆多层的重复劳动。

(2)分步实施策略

馆藏档案数字化不可能一步到位,而且档案室进馆范围档案陆续进馆,进馆范围档案实施档案数字化馆室共建、共赢、共享的策略非常重要。在具体实施过程中,文件级目录数据库建设是最基础性的工作,是第一位需要建全的,但并一定是文件级目录数据库建成后再建其它数据库。专题数据库建设是根据现实需要而适时建立。全文数据库建设是满足信息检索需要而必须加快建设的数据库。

(三)剔除无用,避免浪费策略

1.剔除无用策略

地方档案馆馆藏现行档案主要来自于机关各个立档单位,其档案文件进馆的决定权掌握在立档单位文档人员手里,加之国家档案保管期限表几经修改和许多条款至今还比较笼统,所以,不该归档的、不该进馆的、文件重复的档案进馆颇多。特别是建国超过50年以后,半数左右长期保管的档案逐年超过保管期的最上限,这些档案实际上绝大多数已失去保存和利用的价值,但它们仍占据着档案管理的各种资源。

2.避免浪费策略

面对数字化方法的选择,剔除无用,避免浪费应该是一种长久策略,把大量失去保存价值的档案先剔除,避免把无用档案数字化,再造数字化垃圾。

三、优选档案数字化技术与业务路线

档案数字化建设周期长,信息技术又处在快速发展之中,各个档案馆数字化基础和条件不同。从本馆实际出发,优选档案数字化技术与业务路线特别重要。

(一)计算机新技术与档案数字化业务的有机结合

信息技术的发展给档案数字化效率和质量的提高带来深刻的影响,本着技术为需求服务的理

念,无论是利用哪一种档案管理系统,都要适应档案数字化流程重组和再造需要,适时进行软件升级,通过软件升级固化技术与流程重组与创新,使档案数字化的效果更好。同时,设计符合国家标准与适应自身需要的数据库结构,使档案数字化的过程优化,数字化档案的利用快捷。

(二)档案鉴定与数字化同步

鉴定与数字化同步的目的是加快数字化档案信息的利用。在计算机网络环境下同步进行档案鉴定与数字化工作是发展趋势。这种档案鉴定是以剔除无用档案为前提,以鉴定档案开放为主,按需求筛选全文数字化档案,为适时提供数字化档案信息服务打基础的过程。

(三)档案数字化与上网利用同步

数字化档案分开放与不开放两种。在计算机网络环境中,在确定档案开放与不开放的同时,开放档案即上互联网。开放与不开放档案数据在局域网中即时使用。

案数

字化

及管

理流

程重

组不

可能

一次

到位,

它是一个管理思想不断地变化的过程,适时把新技术和新理念纳入进去是非常重要的。

四、细化档案数字化操作方法

实践证明,在计算机网络环境下,档案数字化和利用服务工程以建立流水作业线,提高工作效率和效益为最佳方式。

(一)优化配置各种资源

档案数字化建设需要投入,特别是建设初期软硬件配置投入较大,建成后也要保持一定的运行成本。地方档案馆在具备一定档案数字化条件的基础上,要按照成本效益最大化理论,根据不同的情况,进行档案专业人员和数字化技工人员、计算机和扫描设备的合理搭配,优

化档案数字化各种资源配置,提高档案数字化建设的投入产出比,构建档案数字化投入小产

出大的新模式。

1.计算机网络环境下档案数字化与利用服务工程流水线资源配置案例

(二)首先建立文件级目录数据库

满足一般检索和管理的需要,建好档案文件级目录数据库。目前,绝大多数综合档案馆,由于没有实现全部档案的文件级目录机检,查找档案不快、不准、不全的问题普遍存在。另外,档案的统计单位主要是卷和延长米,而档案的最小单位是文件的件数,以件为单位的底数不清是普遍存在的问题。所以,把文件级目录数据库建设作为一项基础性工作,在提高档案的查全率、查准率的同时,利用计算机实现档案以件数为基本单位的管理是非常必要的。

1.高度重视文件级目录数据录入的前期处理。档案馆的案卷来自各个立档单位,案卷是由文档人员在档案局业务人员指导下形成的。但是,由于文档人员变动频繁、档案业务指导面多线长,案卷质量难以适应计算机精确管理的需要,加之个别文件形成时的先天不足,给文件级目录数据库建设带来许多麻烦。实践证明,进行文件级目录录入的前期处理,抛开原有的文件目录,按卷内实有文件一一录入,把题名不反映主题、目录与实体不符等一系列问题一并处理是非常必要的。

2.科学合理地设计数据库结构。文件级目录数据库结构包含三方面功能为最佳。一是符合国家有关标准及实际情况,文件题名、责任者等满足文件检索需要的字段。二是存毁、开放、扫描等数字化加工阶段利用的字段。三是数据录入、校对、鉴定、审查等标明责任的字段。

3.数据质量是数据库的生命。建立在计算机环境下,以上网公开利用为根本目的文件级目录数据库,与纸质文件目录有本质的区别。纸质文件目录有问题只有档案馆内部少数人知道,利用者并不清楚。但是,文件级目录数据库进入网络,特别是向社会公开的部分,对数据库的质量要求是相当高的,数据质量也是当前制约许多数据上网利用的瓶颈之一。

数字档案室及档案数字化建设方案

《数字档案室》建设方案适用于机关单位、团体及其他社会组织

目录 一、背景 (1) 二、建设原则 (1) 三、建设目标及内容 (2) (一)建设目标 (2) (二)建设内容 (2) 四、建设方案 (3) (一)数字档案室系统建设方案 (3) (二)档案数据资源建设方案 (13) (三)应用及存储体系建设方案 (15)

一、背景 机关档案工作是国家档案事业的组成部分,也是机关提高工作效率和工作质量的必要条件。随着档案信息化建设的逐步深入,传统机关档案工作面临着机关办公自动化应用、数字档案馆建设以及用户多样化需求的严峻挑战,是档案信息化建设中亟需强化的重要节点。 2015年国家档案局针对机关档案室发布了《数字档案室建设指南》要求逐步实现对数字档案信息资源的网络化管理以及分层次多渠道提供档案信息资源利用和社会共享服务。国家档案局局长李明华在部署工作中强调各地区各部门要依据数字档案馆(室)的建设标准继续推进国家级数字档案馆(室)示范点建设。数字档案室是信息化条件下档案室的“升级版”,是管理机关档案信息、联结机关办公自动化与数字档案馆建设的关键一环。2017年,我公司多次协同各机关档案室建立数字档案室示范单位且赢得了上级主管单位的一致好评。 建设符合国家和社会信息化发展要求的数字档案室,有利于提高机关档案工作水平,维护机关档案信息的真实、完整、可用和安全,提升机关行政效率和公共服务能力;有利于促进国家核心信息资源建设,实现信息资源总量增加、质量提高和结构优化,为数字档案馆的最终实现奠定基础,以推动全国档案信息化工作全面、健康、均衡发展。 二、建设原则 数字档案室建设应当遵循“资源为先,标准规范,整体推进,确保安全”的原则,统筹规划,积极实施,务求实效。 1.1资源为先。资源建设是数字档案室建设的根本。数字档案室应坚持“资源为王”,着眼于数字档案资源建设,着重于非数字档案的数字化和数字档案的及时、完整、有效归档,规划设计以最大限度保证数字档案资源建设质量为根本出发点。数字档案室的建设应该有助于保障数字档案资源的齐全、完整,有利于数字档案资源的有效管理和方便利用。

档案数字化加工项目实施计划方案

新都建设局档案数字化加工项目 实施方案 目录 一、项目概述............................................................................................................ 错误!未定义书签。 1、项目需求分析.......................................................................................... 错误!未定义书签。 1.1档案内容及数量(现场调研)............................................. 错误!未定义书签。 1.2档案数字化环节及质量要求.................................................. 错误!未定义书签。 1.3档案验收.............................................................................................. 错误!未定义书签。 1.4档案安全要求................................................................................... 错误!未定义书签。 二、项目实施准备................................................................................................. 错误!未定义书签。 1、设备配套........................................................................................................ 错误!未定义书签。 2、人员配备........................................................................................................ 错误!未定义书签。 三、项目实施............................................................................................................ 错误!未定义书签。 1、总体实施原则............................................................................................. 错误!未定义书签。 2、人员岗位安排............................................................................................. 错误!未定义书签。 3、项目实施流程............................................................................................. 错误!未定义书签。 3.1档案借出.............................................................................................. 错误!未定义书签。 3.2档案整理排序分卷........................................................................ 错误!未定义书签。 3.3档案录入.............................................................................................. 错误!未定义书签。 3.4整理环节检查................................................................................... 错误!未定义书签。

档案数字化方案

档案室、档案馆 馆藏档案扫描、数字化加工 整体解决方案 武汉宝和人通数字科技有限公司 目录 第一节质数字化加工作业前期准备 (1) 一、数字化工作人员准备 (1) 二、数字化工作软件、硬件准备 (4) 三、确定数字化内容、数量及用户需求 (5)

第二节数字化加工流程及主要技术方案 (6) 一、入库提卷、拆卷 (6) 二、标引著录 (7) 三、档案扫描 (8) 四、图像处理 (11) 五、全文OCR、生成双层pdf、板式还原及格式 (12) 六、总质检 (14) 七、批量挂接 (15) 八、还卷及数据备份提交 (15) 第三节质量控制方案和保证措施 (17) 一、加工质量保障措施 (17) 二、多环节,多层次的质量检查体系 (17) 三、阶段性验收与终验相结合的严格验收程序是质量控制的终级保障 (19) 第四节安全保密控制 (21) 保密协议 (22) 第五节售后服务 (24) 项目背景 —————————————————— 随着全国文化信息资源共享工程与中国数字图书馆工程的起动,信息化已成为国际潮流,信息资源建设成为当务之急。信息资源建设的重点是电子文献、

各类数据库、网络资源、电子档案、电子图书等新型数字化信息资源的建设。在数字化信息资源建设中,很大的一个需求是将现有的纸介质印刷品数字化,使之成为能够用计算机阅读、理解、查询、检索的电子文件,最终将其应用于数据库存储,或通过CD-ROM、Internet网进行出版,或上传数字档案馆供用户使用。 以传统纸张为载体的保存方式,占据了大量的空间,需要特殊的环境,而且不方便查询,随着时间的推移,还面临着腐蚀、老化等问题。而将纸介质文件信息进行电子化处理,保存到光盘上,具有存储、管理、共享等功能,还可以减少文件库房占地,节省保管设备和人员方面开支,又方便统计和进行远程查询。 因此,将档案、期刊、文件等资料通过扫描仪,扫描成图像文件,再通过处理转换成电子文档,建立目录和索引,制作成电子文件,已是当务之急。 公司简介—————————————————————————————— 武汉宝和人通数字科技有限责任公司(前身是湖北华新职业学院数字科研中心)成立于1994年,是在原国家科委的支持下,为推进建设国家“211工程”高等学校中英文图书数字化国际合作计划(China-America Digital

档案数字化建设方案

档案数字化建设方案 根据。。约定,为完成。档案数字化工作,特制定工作方案。 一、工作目标 为保障文件和数字化信息安全,保证档案数字化工作质量,规划工作流程,尽快完成档案数字化工作。 二、工作机构 成立档案数字化工作小组,具体负责开展档案扫描的各项具体工作。 组 长: (职责:制定项目工作方案、协调扫描工作开展) 副组长: (职责:系统安装部署) 成 员: (职责:对系统硬件、网络环境进行部署,确保能够通过网络访问系统) (职责:具体负责扫描工作开展,要求每周进行档案扫描工作汇报) 其他人员: 三、档案数字化数量 扫描后的图像页数总计4.6万页,单面A4幅面按1页计算,双面A4按2页计算,大幅A3单面按2页A4幅面计算,大幅A3双面按4页A4幅面计算。 四、工作时间: 五、工作流程

(一)系统环境部署:在新购的服务器上安装档案管理系统(下称档案系统),并进行系统网络调试,确保系统使用正常。 (二)档案交接 1、办理交接手续:由业主整理需要进行扫描的档案,统计档案份数后移交至我方,我方根据业主统计出的信息进行档案清点数量,并核对文件是否有缺号或跳号、附件是否正确,确认无误后双方人员签字。 2、档案运输:双方各派专人共同运输档案至扫描地点,并在运输到达目的地后再次与档案扫描的工作人员进行档案详情确认。 (三)档案整理 1、档案页数清点:档案扫描工作人员对档案目录标注的档案页数与实际档案页数进行清点,数量不符时,应按实际情况进行修改。 2、档案预处理:扫描之前,应在保护文件不受损害的前提下,拆除装订物,对折皱不平等影响扫描质量的原件先进行相应处理(压平或熨平等),确保扫描图像清晰。 (四)档案数字化 1、文件扫描:扫描分辨率规定为200DPI。档案扫描工作人员核对扫描的条目与实体相符后,逐份对文件进行扫描,扫描时根据文件幅面大小和纸张状况,可采取连续进纸扫描或平板扫描,扫描过程中不得损坏纸质文件,扫描完成后,纸质文件应按顺序存放。 2、质量自检及数据提交:档案扫描工作人员对扫描文件质量及挂接情况逐份进行审查,发现不合格的,应当重新处理,确认质量合格后

档案数字化项目投标技术方案设计

一、项目实施案 (一)项目实施的依据 1、《人民国档案法》 2、《机关文件材料归档围和文书档案保管期限规定》(档案局第8号令) 3、档案局《CAD电子文件光盘存储、归档与档案管理要求》GB/T17678.1—1999 4、《归档文件整理规则》》(DA/T 22—2015) 5、《档案著录规则》(DA/T18-1999)。 6、《纸制档案数字化技术规》(DAT-31-2017) 7、《电子文件归档与管理规》GB/T18894—2002 (二)项目实施前准备 1、人员准备 (1)甲人员 职务:现场交接管理人员 职责:①负责与乙的档案提卷和还卷等交接工作,协同甲人员作好交接清单记录并签字。②负责监督乙规化加工。③随时把握乙加工进度并进行协调。④及时关注并抽查乙加工质量。⑤代表甲与乙进行及时的沟通及问题协调,确保项目顺利完工。 (2)乙人员 2.1 管理人员:主要为熟悉现场加工管理,熟悉数字化整体作业流程,具有较强组织能力和现场管理及沟通能力的乙负责人。 2.2 工程技术人员:主要为熟悉计算机软、硬件技术,了解档案数据库标准和系统开发。了解档案管理等相关专业知识的乙技术支持工程师。 2.3 数据采集作业员:主要为了解档案数据库数据标准和计算机软件应用等相关知识的乙数字化制作工作人员

2、项目设备设施准备 (1)主要加工设备及其技术参数

数字化加工过程中使用的数字化加工管理软件,是档案数字化加工的主要应用工具,也是确保档案数字化加工工作效率和成果质量的关键技术。档案数字化加工软件必须具有扫描、图像处理、著录、校对、质检、自动挂接、查询检索、数据转换、数据上传、数据统计、打印传输等功能,能够满足档案数字化加工全流程各业务环节的需要,以及对加工数据进行质量检查和验收的需要。 (3)其他辅助加工设备 除上述主要加工设备外,在档案数字化加工现场,还需要配备以下辅助设备:办公桌椅、档案存储柜、储物柜、装订机、电熨斗、切纸机、抽湿机、碎纸机以及纸、档案卷皮、档案盒、装订线、胶水等消耗材料。具体参照招标文件要求或合同约定配置。 3、场地部署准备 (1)各单位应配备专用的数字化加工场地,并进行合理布局,形成档案存放、数字化前处理、档案著录、档案扫描、图像处理、质量检查等工作区域。一般设在档案部门独立、可封闭的建筑。

纸质档案数字化技术规范

纸质档案数字化技术规范 Specification for Digitization of Paper-Based Records 1 范围 本标准规定了纸质档案数字化的主要技术要求。 本标准适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。 2 规范性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 GB/T 17235.1 连续色调静态图像的数字压缩编码第一部分:要求和指南 GB/T 17235.2 连续色调静态图像的数字压缩编码第二部分:一致性测试 GB/T 18894 电子文件归档与管理规范 3 术语和定义 下列术语和定义适用于本标准。 3.1 数字化digitization 用计算机技术将模拟信号转换为数字信号的处理过程。 3.2 纸质档案数字化digitization of paper-based records 采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。 3.3 数字图像digital image 表示实物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样——连续函数,并在采样点上将值最小化后的阵列。 3.4 黑白二值图像binary image 只有黑白两级灰度的数字图像。它对应于黑白两种状态的文字稿、线条图等。

数字化档案建设方案

数字化档案建设方 案

数字化房产档案建设方案 档案工作的数字化建设是顺应潮流,适应时代发展的新举措。随着城市的发展和进步,房产档案的形成会越来越多,类别越来越细,而传统手工作业方法已经呈现出了许多弊端:效能低、错误多、易损毁、易丢失。因此数字化档案的建设在当前的档案管理工作中的重要性正日益凸显出来。对于我局档案馆的数字化建设特制定以下方案: 一、制定批次 为在数字化处理过程中对纸质档案进行有效的管理及对数字化处理进行有效控制,需对馆藏的档案按照类别进行批次安排,确保在数字化过程中有序进行。 二、数字化处理 1、档案出库交接 根据数字化加工批次计划进行出库,对出库的档案进行完整性检查,对经过完整性检查的档案,进行数量确认,并详细登记《档案出库单》,确保交接中档案数量的正确性和完整性。 2、目录制定及档案整理 按照文件数据库目录结构及目录著录要求,规范需要目录补录的档案目录内容,包括确定档案目录的著录项、字度长度等规范要求。 对出库档案进行数字化加工前,需对档案文件进行扫描前处理,使之成为能够进行扫描的形态。对影响扫描的非成册档案装

订进行拆除装订物,对破损严重,无法进行扫描的文件应进行技术处理,如纸张褶皱无法扫描的应进行压平等处理。对于档案内的资料应区分扫描件和非扫描件,并详细记录,确保档案内的资料不乱不丢。扫描完成后按照档案馆的要求进行装订,保证每卷档案不掉页,边缘整齐。 3、档案扫描 根据文件数据库要求的规格进行档案扫描,保证扫描件图像效果与原件吻合。大幅面档案采用大幅面扫描仪或者小扫描仪扫描后进行图片拼接。核对每份文件的扫描页码、页数与实际的文件页码、页数是否一致。对扫描图像进行命名时一定要正确,不能出现图片颠倒、错乱等现象,扫描时要保证档案原件不被损坏。 4、图像处理 对颠倒、偏斜的图像进行纠偏处理,以符合阅读习惯。对页面中影响阅读的污点、黑线、黑边等杂质进行去污处理。对颜色深浅度进行调整,确保图像字迹清晰,对大幅面扫描所形成多幅图像进行拼接,合并为一个完整图像,以保证数字化图像的完整性。 5、文件录入 根据数字档案管理的软件以及文件数据库的要求,将扫描后的图像按照档案编码进行录入,在录入过程中要做到不漏页、不乱页,对录入的文件要进行准确性核对,确保文件的完整。

档案数字化建设方案

档案数字化建设方案 档案丄作的数字化建设是顺应潮流,适应时代发展的新举措、新要求,档案做为原生的信息资源,其重要性正日益凸显出来,逐步掌握信息技术为档案工作服务,为社会主义经济建设服务,为社会主义精神建设服务。 档案数字化是数字档案建设最基础的工作,传统载体的档案经高科技技术加工成数字档案形式,通过局域网、政务网、互联网进行计算检索、阅读电子档案,为迎接档案信息服务新环境的挑战、提高管理水平、提高效率、增强档案部门的服务水平、为档案内部管理及面向客户服务提供高效率的全面服务。 完整的档案数字化建设流程包括案卷交接、档案整理、LI录著录、档案扫描、图像处理、OCR文字识别、数字校对、数字质检、数据挂接、整理还原、案卷入库等环节。 业务流程 纸质档案数字化标准:DA/T31-2005《纸质档案数字化技术规范》 DA/T18-1999《档案著录规则》1.制订批次计划 为在数字化处理过程中对纸质档案进行有效管理以及对数字化处 理进行有效控制,需对馆藏档案的数字化处理分批次进行。2.档案出库交接 根据档案数字化加工批次讣划进行出库,对出库的档案进行完整 性检查。 对通过完整性检查的档案,进行数量确认,并详细登记《资料出库单》。 确保资料的交接过程中的数量正确性,完整性; 3.目录著作

按照文件数据库LI录结构与LI录著录要求以及《档案著录规则》(DA/T18)等标准,规范需要LI录补录的档案口录内容,包括确定档案LI录的著录项、字段长度和内容要求等,规范案卷题名、文件名、责任者、起止页号和页数等。 4.档案整理 对出库待加工的档案进行扫描前处理,使之成为能够进行扫描的形态。 拆除装订 影响扫描工作进行的档案,应拆除装订物。 资料及档案内的成册资料严禁拆除。 区分扫描件和非扫描件 区分同一案卷(卷、件)中的扫描件和非扫描件。页面修整 对破损严重、无法直接进行扫描的档案,先期进行技术修复,折皱不平影响扫描质量的原件进行相应技术处理(压平和烫平等)后再进行扫描。确保较薄纸张(如信纸、便笺纸)、破损纸张、底灰较深(如草浆纸、油印纸)、字迹较浅(如铅笔字迹)等纸张的状况较较差的档案扫描图像清晰。 档案整理登记 详细记录档案整理后每份文件的起止页号和页数等情况。装订 扫描完成后,档案按原档案保管单位要求进行重新装订,保持每页档案原有的排列顺序不变、案卷不掉页、右边和底边整齐。 5.档案扫描 黑白扫描采用(300dpi) TIFF格式,彩色扫描采用(300dpi) JPG格式。 照片以原色彩为准(600dpi) TIFF格式扫描。 保证扫描图像效果原原件吻合。 大幅面档案采用大幅面匸程扫描仪或小幅面扫描后进行图像拼接处理。 需要进行OCR文字识别的档案,扫描分辨率?300dpio对资料等成册材料不宜拆卷

档案数字化项目投标技术方案设计

一、项目实施方案 (一)项目实施的依据 1、《中华人民共和国档案法》 2、《机关文件材料归档范围和文书档案保管期限规定》(国家档案局第8号令) 3、国家档案局《CAD电子文件光盘存储、归档与档案管理要求》GB/T17678.1—1999 4、《归档文件整理规则》》(DA/T 22—2015) 5、《档案著录规则》(DA/T18-1999)。 6、《纸制档案数字化技术规范》(DAT-31-2017) 7、《电子文件归档与管理规范》GB/T18894—2002 (二)项目实施前准备 1、人员准备 (1)甲方人员 职务:现场交接管理人员 职责:①负责与乙方的档案提卷和还卷等交接工作,协同甲方人员作好交接清单记录并签字。②负责监督乙方规范化加工。③随时把握乙方加工进度并进行协调。④及时关注并抽查乙方加工质量。⑤代表甲方与乙方进行及时的沟通及问题协调,确保项目顺利完工。(2)乙方人员 2.1 管理人员:主要为熟悉现场加工管理,熟悉数字化整体作业流程,具有较强组织能力和现场管理及沟通能力的乙方负责人。 2.2 工程技术人员:主要为熟悉计算机软、硬件技术,了解档案数据库标准和系统开发。了解档案管理等相关专业知识的乙方技术支持工程师。 2.3 数据采集作业员:主要为了解档案数据库数据标准和计算机软件应用等相关知识的乙方数字化制作工作人员

2、项目设备设施准备 (1)主要加工设备及其技术参数

数字化加工过程中使用的数字化加工管理软件,是档案数字化加工的主要应用工具,也是确保档案数字化加工工作效率和成果质量的关键技术。档案数字化加工软件必须具有扫描、图像处理、著录、校对、质检、自动挂接、查询检索、数据转换、数据上传、数据统计、打印传输等功能,能够满足档案数字化加工全流程各业务环节的需要,以及对加工数据进行质量检查和验收的需要。 (3)其他辅助加工设备 除上述主要加工设备外,在档案数字化加工现场,还需要配备以下辅助设备:办公桌椅、档案存储柜、储物柜、装订机、电熨斗、切纸机、抽湿机、碎纸机以及纸张、档案卷皮、档案盒、装订线、胶水等消耗材料。具体参照招标文件要求或合同约定配置。 3、场地部署准备 (1)各单位应配备专用的数字化加工场地,并进行合理布局,形成档案存放、数字化前处理、档案著录、档案扫描、图像处理、质量检查等工作区域。一般设在档案部门独立、可封闭的建筑内。 (2)数字化加工场地应符合防盗、防火、防尘、防水、防潮、防高温、防日光及紫外线照射、防有害生物、防污染等安全管理要求。场地内应配备可覆盖全部场地的报警、防火等应急设施设备。 (3)数字化加工场地应配备满足安全管理需要的视频监控设备,确保档案暂存处、数字化加工工位、服务器、数据导出端及门窗等无监控死角;视频监控数据自产生之日起保存不少于6个月,涉密档案数字化加工监控录像要保存到项目完工数据移交1个月后;档案部门应定期对视频监控数据进行回放检查,在删除视频监控数据之前,要留存视频回放安全检查记录。 (4)数字化加工场地应配备符合国家标准并满足工作需要的档案装具,用于分别存放待数字化处理和已数字化处理的档案。 (5)各单位和数字化服务机构应合理规划、配备和管理档案数字化设施设备,确保设施设备安全、先进,能够满足数字化工作的需要。 (6)数字化加工场地须封断所有档案数字化加工设备的无线网络功能以及非必要的各终端接口,各单位和数字化服务机构应定期进行相关检测。如有必要,应由县档案局构建数字化加工专用局域网和视频监控专用网。

档案数字化加工方案和投标书

1 项目建设内容 ................................................ 2 历史档案数字化处理标准 ...................................... 2.1. ............................. 纸质档案数字化处理标准 2.2. ................................. 照片档案数字化标准 2.3. ................................. 声音档案数字化标准 2.4. ................................. 影像档案数字化标准 2.5. ................................. 实物档案数字化标准 3 数字化加工环节 .............................................. 3.1. ........................................... 档案接收 3.2. ....................... 标准的目录结构和文件夹的建立 3.3. ..................................... 建立目录数据库 3.4. ................................. 档案着录的工作细节 3.5. ........................................... 档案整理 3.6. ........................................... 档案扫描 3.7. ........................................... 图像处理 3.8. ............... 质检岗位:图像初检和复检(一检、二检) 3.9. ......................... 着录标记一稿双录、人机校验 3.10. .......................................... 数据挂接 3.11. .............. 数据成品信息准确性和完整性检查(终检) 3.12. .......................................... 光盘制作 历史档案数字化加工解决方案 东软集团股份有限公司 2011年02月

国土资源局档案数字化项目解决方案

档案数字化解决方案

1立项背景 在市县级政府各部门中,国土资源局是设立较晚的一个部门,然而国土资源部门目前承担的管理职能,使其产生了大量的各类档案需要管理。传统县级国土资源档案管理采取手工方式,档案的接收、整理、鉴定、保管、利用、编研等工作都主要以手工为主,这中间包括建立全引目录本、索引卡等。这种方式工作效率较低,国土资源档案得不到充分利用。 部分国土资源部门的档案管理信息化采用了一般的条目管理方式的方案,这种方式对于纯粹的档案管理来说促进了档案管理的现代化,但对于国土资源部门来说,大量的档案是通过办事流程产生的,与以档案馆档案管理模式开发的档案管理系统在模式上存在显著的不同。 另外现有的地籍系统、土地利用系统和土地交易系统的数据分散三个独立的系统中,数据格式多样,给土地归档工作带来了不便,急需把各个部门各个系统的相关数据进行同一归档管理。 所以建立优质、高效、具有国土资源特点的档案管理信息化系统,建设国土资源局数字档案室,不仅从根本上解决传统手工作业方式所带来的诸多问题,而且能更好的促进国土资源局信息化建设的快速发展,保障土地档案信息的有效管理利用,还为今后逐步建立国土电子政务系统打下良好的基础。 2核心任务和根本目的 国土资源局数字档案室建设的核心任务是档案信息的数字化。一方面将现有档案,包括各种纸质档案、照片档案、声像档案等进行数字化处理;另一方面收集整理工作过程中形成的大量的电子文件档案,这种收集可以是文本、图形、图像、声音、视频等各种形式。并将档案信息与国土资源局的办公业务相关联,同时实现档案库房温湿度的自动监测。 数字档案室建设的根本目的是利用虚拟化的网络优势、智能化的检索手段和先进的GIS技术,将档案信息进行集中统一管理,实现档案和图形的相互查询,

DA/T31-2005纸质档案数字化技术规范

纸质档案数字化技术规范(DA/T31--2005) 1 范围 本标准规定了纸质档案数字化的主要技术要求。 本标准适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。 2 规范性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 GB/T 17235.1-1998 信息技术连续色调静态图像的数字压缩编码第一部分:要求和指南 GB/T 17235.2-1998 信息技术连续色调静态图像的数字压缩编码第二部分:一致性测试 GB/T 18894-2002 电子文件归档与管理规范 3 术语和定义 下列术语和定义适用于本标准。 3.1

数字化digitization 用计算机技术将模拟信号转换为数字信号的处理过程。 3.2 纸质档案数字化digitization of paper-based records 采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。 3.3 数字图像digital image 表示实物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样--连续函数,并在采样点上将值最小化后的阵列。 3.4 黑白二值图像binary image 只有黑白两级灰度的数字图像。它对应于黑白两种状态的文字稿、线条图等。 3.5 连续色调静态图像continuous-tone still image 以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态 数字图像。在纸质档案数字化过程中,通常表现为灰度扫描和彩色扫描两种模式。 3.6

档案数字化加工方案计划

(三)数字化加工部分 (2) 6.1.需求分析与总结 (2) 6.2.参考的国家标准及技术规范 (2) 6.3.数字化加工实施细则 (3) 6.9.1.本项的扫描加工流程 (3) 6.9.2.生产流程有以下几个主要的步骤组成: (4) 6.9.3.档案整理 (5) 6.9.4.著录标引 (6) 6.9.5.纸件扫描 (7) 6.9.6.图像处理 (8) 6.9.7.质量检验 (10) 6.9.8.档案还原装订 (10) 6.9.9.数据存储与备份 (12) 6.9.10.档案电子数据与XXXXXX烟草档案系统的无缝挂接 (12) 6.4.项目所采用的OCR处理技术介绍 (12) 6.10.1.OCR(光学字符识别)技术 (12) 6.10.2.所采用的OCR及双层PDF生产流程 (13) 6.10.3.生产流程逻辑示意图 (14) 6.5.XXXXXX档案数字化服务特点 (15) 6.11.1.自动化程度高 (15) 6.11.2.标准化程度高 (15) 6.11.3.严格的质量控制 (15) 6.11.4.文档安全性高 (15) 6.11.5.标准的格式 (15) 6.11.6.方便存储与管理 (16)

(三)数字化加工部分 6.1.需求分析与总结 此次项目是将中国烟草总公司XXXXXX省公司及所属11个市烟草公司的约183万页纸质档案进行数字化加工并将成品数据挂接到档案管理系统中,纸质档案的折分整理、扫描与图像处理、数据的挂接与光盘备份都将严格按照国家档案局相关标准及XXXXXX省档案局相关规定,结合XXXXXX烟草档案现状定制加工技术规范与生产加工流程。 。据上述现状,具体人员安排,项目实施周期,采用标准及实施细则如下。 6.2. 参考的国家标准及技术规范 《纸质档案数字化技术规范》(DA/T 31—2005) 《连续色调静态图像的数字压缩及编码》(GB/T 17235.1-1998) 《电子文件归档与管理规范》(GB/T 18894-2002) 《中央档案馆接收档案的标准》 《XXXXXX省档案接收和收集管理相关规定 《归档文件整理规则》(DA/T22-2000) 《档案著录规则》(DA/T 18-1999) 《无酸档案卷皮卷盒用纸及纸板》(DA/T 24-2000) 《档案修裱技术规范》(DA/T 25-2000) 《XXXXXXXXXXXX档案数字化技术规范》 《XXXXXX烟草档案数字化技术规范》

纸质档案数字化规范DAT31—2017

纸质档案数字化规范DA/T31—2017 前言 本标准按照GB/T 1.1-2009给出的规则起草。本标准替代DA/T 31-2005《纸质档案数字化技术规范》。 本标准与DA/T 31-2005相比,主要技术变化如下: ——标题进行了修改; ——增强组织与管理部分的内容,完善数字化工作中管理相关要求; ——增强数字化前处理部分的内容,包括对实体档案保护和档案规范化管理方面的要求; ——增加数字化过程中元数据采集的要求; ——修改了档案扫描部分参数要求; ——修改了图像处理部分内容,更加强调保持档案原貌的要求; ——细化了数字化成果验收的内容; ——删除原标准数据备份和数字化成果管理相关内容。本标准由国家档案局提出并归口。 本标准起草单位:国家档案局档案科学技术研究所、国家档案局信息管理中心、国家档案局技术部。 本标准主要起草人:王良城、马淑桂、郝晨辉、程春雨、杜琳琳、蔡伟、宋涌、王大众、田军、曹燕、李华峰。本标准所代替标准的历次版本发布情况为:——DA/T 31—2005。

引言 DA/T 31-2005的发布实施,从技术标准方面对纸质档案数字化工作提出了要求,很好的促进了纸质档案数字化工作向科学化、规范化的方向发展,在档案信息化工作中发挥了重要作用。 由于纸质档案数字化工作所依赖的信息技术发展迅速,经过10年的时间,数字化设备、存储、网络等技术条件都发生了较大变化,同时,纸质档案数字化工作管理方法和管理理念等都在不断更新、发展。因此,及时对本标准进行修订,适时调整相关要求,从档案行业层面科学规范纸质档案数字化工作,具有重要的现实意义。 标准本次修订更加注重我国纸质档案数字化工作自身的特点,结合目前信息技术发展的水平,提出适用于档案行业的纸质档案数字化工作的规范性要求。

数字档案室档案数字化建设实施方案

《数字档案室》建设案适用于机关单位、团体及其他社会组织

目录 一、背景 (1) 二、建设原则 (1) 三、建设目标及容 (2) (一)建设目标 (2) (二)建设容 (2) 四、建设案 (3) (一)数字档案室系统建设案 (3) (二)档案数据资源建设案 (13) (三)应用及存储体系建设案 (15)

一、背景 机关档案工作是档案事业的组成部分,也是机关提高工作效率和工作质量的必要条件。随着档案信息化建设的逐步深入,传统机关档案工作面临着机关办公自动化应用、数字档案馆建设以及用户多样化需求的峻挑战,是档案信息化建设中亟需强化的重要节点。 2015年档案局针对机关档案室发布了《数字档案室建设指南》要求逐步实现对数字档案信息资源的网络化管理以及分层次多渠道提供档案信息资源利用和社会共享服务。档案局局长明华在部署工作中强调各地区各部门要依据数字档案馆(室)的建设标准继续推进级数字档案馆(室)示点建设。数字档案室是信息化条件下档案室的“升级版”,是管理机关档案信息、联结机关办公自动化与数字档案馆建设的关键一环。2017年,我公司多次协同各机关档案室建立数字档案室示单位且赢得了上级主管单位的一致好评。 建设符合和社会信息化发展要求的数字档案室,有利于提高机关档案工作水平,维护机关档案信息的真实、完整、可用和安全,提升机关行政效率和公共服务能力;有利于促进核心信息资源建设,实现信息资源总量增加、质量提高和结构优化,为数字档案馆的最终实现奠定基础,以推动全国档案信息化工作全面、健康、均衡发展。 二、建设原则 数字档案室建设应当遵循“资源为先,标准规,整体推进,确保安全”的原则,统筹规划,积极实施,务效。

档案数字化实施方案

档案数字化实施方案 Implementation plan of archives digitization 汇报人:JinTai College

档案数字化实施方案 前言:本文档根据题材书写内容要求展开,具有实践指导意义,适用于组织或个人。便于学习和使用,本文档下载后内容可按需编辑修改及打印。 为了进一步加强黄冈市档案馆信息化建设,根据国家档 案局、中央档案馆《全国档案信息化建设实施纲要》、湖北省档案局《湖北省档案信息化建设十年规划》及市委、市政府对档案信息化工作的要求,结合我局工作实际,制定本实施方案。 一、指导思想和基本原则 档案信息化建设的指导思想:以邓小平理论、“三个代表”和科学发展观为指导,坚持档案工作紧紧围绕市委、市政府中心工作,服务全市经济社会发展。以档案信息资源开发利用为核心,以建设档案信息网络,促进公共服务为目的,积极推进档案接收电子化、档案存储数字化、档案管理自动化和档案服务网络化的进程,促进档案事业持续、健康、快速发展,为全面建设小康社会服务。 档案信息化建设的基本原则:遵循“统筹规划、分级负责;项目带动、稳步实施;需求导向、典型示范;多措并举、安 全可控”的原则,加快推进档案信息化建设步伐。

二、总体目标 加快档案信息化基础设施建设,加强电子文件归档和电 子档案的规范化管理,稳步实施存量档案数字化,增量档案电子化,建立数字化综合应用平台,开展已经公开现行文件和档案信息网上查询服务,积极推进数字档案馆和数字档案室建设,全面提高档案工作的质量和效率,建设一支适应档案信息化发展需要的人才队伍,满足社会各界日益增长的档案信息利用需求。 三、主要任务 1.加快推进档案馆数据库建设。逐步建立档案数据库, 到20xx年完成馆藏17完卷档案的数字化转换工作,实现档案全文信息查询,不断提高服务效率和质量。 2.加强电子文件归档管理。加强对全市机关和企事业单 位的电子文件积累、鉴定、著录、归档等工作的监督、指导,保证各单位产生的有保存价值的电子文件真实、完整、有效。做好1996年建市前市直机关单位电子档案的移交接收工作。 逐步实现电子文件与纸质文件同步归档和有效管理。 3.充分利用和发挥网站的作用。不断丰富网站内容,有 计划地上传开放档案目录,向社会提供网上查询和利用服务,

DAT 31-2017《纸质档案数字化规范》

目录 前言 (4) 引言 (6) 纸质档案数字化规范 (7) 1 范围 (7) 2 规范性引用文件 (7) 3 术语和定义 (7) 4 总则 (8) 5.组织与管理 (9) 5.1 机构及人员 (9) 5.2 基础设施 (10) 5.3 工作方案 (10) 5.4 管理制度 (11) 5.5 工作流程控制 (12) 5.6 工作文件管理 (12) 5.7 档案数字化外包 (13) 6 档案出库 (14) 7 数字化前处理 (14) 7.1 确定扫描页 (14) 7.2 编制页号 (14) 7.3 目录数据准备 (15) 7.4 拆除装订 (15)

8 目录数据库建立 (15) 9 档案扫描 (16) 9.1 基本要求 (16) 9.2 扫描设备 (17) 9.3 扫描色彩模式 (17) 9.4 扫描分辨率 (18) 9.5 存储格式 (18) 9.6 图像命名 (19) 10 图像处理 (19) 10.1 图像拼接 (19) 10.2 旋转及纠偏 (19) 10.3 裁边 (20) 10.4 去污 (20) 10.5 图像质量检查 (20) 11 数据挂接 (20) 12 数字化成果验收与移交 (21) 12.1 验收方式 (21) 12.2 验收内容 (21) 12.3 验收指标 (22) 12.4 验收结论 (22) 12.5 移交 (23)

前言 本标准按照GB/T 1.1-2009给出的规则起草。 本标准替代DA/T 31-2005《纸质档案数字化技术规范》。 本标准与DA/T 31-2005相比,主要技术变化如下: ——标题进行了修改; ——增强组织与管理部分的内容,完善数字化工作中管理相关要求; ——增强数字化前处理部分的内容,包括对实体档案保护和档案规范化管理方面的要求; ——增加数字化过程中元数据采集的要求; ——修改了档案扫描部分参数要求; ——修改了图像处理部分内容,更加强调保持档案原貌的要求; ——细化了数字化成果验收的内容; ——删除原标准数据备份和数字化成果管理相关内容。 本标准由国家档案局提出并归口。 本标准起草单位:国家档案局档案科学技术研究所、国家档案局信息管理中心、国家档案局技术部。 本标准主要起草人:王良城、马淑桂、郝晨辉、程春雨、杜琳琳、蔡伟、宋涌、王大众、田军、曹燕、李华峰。 本标准所代替标准的历次版本发布情况为:

数字化档案馆建设指南

数字档案馆建设指南 (国家档案局发布2010年6月) 1.总体要求 1.1概述 数字档案馆是指各级各类档案馆为适应信息社会日益增长的对档案信息资源管理、利用需求,运用现代信息、技术对数字档案信息进行采集、加工、存储、管理,并通过各种网络平台提供公共档案信息服务和共享利用的档案信息集成管理系统。 建没数字档案馆,有利于提高档案馆工作效率和现代化水平,有利于确保数字档案永久存储与安全保管,有利于促进公共档案服务能力拓展和实现档案信息资源的社会共享。 建没数字档案馆.有利于促进国家信息资源总量增加、质量提高和结构优化,有利于提高各级政府公共服务能力,有利于促进社会主义文化的发展繁荣,有利于满足广大人民群众对现代信息服务的现实需求。 数字档案馆建设是一项系统工程,需要经过调研、立项、论证、软件开发、平台构建、资源准备、系统试运行、项目验收、运行维护等诸多环节,需要各业务部门、档案管理部门以及其他相关单位的共同参与,是一项长期的工作任务。 1.2建设原则与要求 数字档案馆建设应当遵照“统筹规划、循序渐进,项目带动、重点突破,需求导向、保证安全,合理适用、稳步实施”的原则,积极推进,务求实效。 统筹规划、循序渐进。应当根据各级政府电子政务建设整体框架和基本要求,及时将数字档案馆建设与区域电子政务和信息化建设相衔接,综合考虑自身信息化发展水平、技术力量、资源规模、基础工作水平、资金投入等因素,确定总体布局和实施步骤。 项目带动、重点突破。实施项目带动战略,支撑和带动数字档案馆整体建设和发展将数字档案馆建设分成若干子项目,以项目带动数

字档案馆建设及推进各项工作的开展,有利于获得党委政府和有关部门的重视和投入,有利于集中人力物力有针对性地重点解决数字档案馆建设中的核心问题。 需求导向、保证安全。数字档案馆建设应以需求为导向,着眼于党政机关、社会公众在线利用数字档案信息资源的需求,推动档案信息资源的共享。应当按照信息安全等级保护的要求,采取相应的安全保障技术方法,配备必要的软硬件没施,建立健全安全管理制度,完善灾难恢复服务机制,确保数字档案馆建设和运行的安全。 合理适用、稳步实施。要重视前期调研,进行可行性研究,结合本部门业务工作实际,提出创新性高、应用性强的功能需求,以确保系统开发和项目建设的合理性、适用性。在项目实施过程中,档案部门的业务人员应全程参与,及时研究和发现问题,纠正偏差。重大项目应当按照信息系统建设规范要求,引入监理机制,对项目质量、进度、投资、安全等方面进行全程监理。 1.3建设目标 数字档案馆建设的目标是:紧紧依靠国家和当地信息化基础设施建设环境,充分利用各种政务网平台、公众网平台以及各类网络资源,以先进的信息技术为手段,集成建设适应本部门本单位一定时期内数字档案管理需要的网络平台,开发应用符合功能要求的管理系统,推动馆藏档案资源数字化、增量档案电子化,逐步实现对数字档案信息资源的网络化管理以及分层次多渠道提供档案信息资源利用和社会 共享服务。 其中,数字档案信息、资源建设、提供档案信息利用和社会共享服务,是一项长期任务,应分阶段推进,有步骤实现。 1.4建设内容 数字档案馆总体建设内容主要包括: (l)按照数字档案馆基础网络架构、主要技术路线与软硬件配 置基本要求,集成建设适应馆藏档案基础数据和今后一定时期内数字

相关文档
相关文档 最新文档