文档库 最新最全的文档下载
当前位置:文档库 › 档案数字化扫描加工项目技术参数和要求

档案数字化扫描加工项目技术参数和要求

档案数字化扫描加工项目技术参数和要求
档案数字化扫描加工项目技术参数和要求

广元市档案馆档案数字化扫描加工项目技术参数和要求

本项目采购的内容包括档案资料分拆卷、页码校核、档案整理、档案修复、全文扫描、图像处理、图像半成品质检及存储、档案分件、系统数据入库、挂接、机读目录上传、全文上传、全文数据质检并提供质检报告等服务。

一、项目描述

1.1纸质档案数字化需求

1.1.1项目概况

本次档案数字化加工数量 200 万页,条目着录(含修正)约 22 万条。为确保后期档案查询利用效果,在本次项目中,已具备电子目录的,需要对档案条目信息进行校对修正,无电子目录的需要补录,另外需要对本期项目涉及到的库存档案资料进行电子化扫描、图

像处理、数据入库、挂接、机读目录上传、全文上传、全文数据质检并提供质检报告等服务。以下为具体要求:

1.1.2标准依据

DA/T 31-2005 《纸质档案数字化技术规范》;

DA/T18-1999 《档案着录规则》;

GB/T 18894-2002 《电子文件归档与管理规范》;

DA/T25——2000 《档案修裱技术规范》

GB/T9705——88《文书档案案卷格式》

1.1.3技术要求

1.1.3.1.属性数据录入

(1)此次招标工作中属性数据录入方面要求对已有数据的案卷进行校对、补录;对未录的案卷要按照要求录入,符合有关规范要求。

(2)其他业务档案需按照类型以不同字段进行录入,主要包括年度,文号,公文类型等。

1.1.3.

2.影像扫描

(1)工作量

本次招标的工程量约为200 万页,要求提交成品为真彩24位JPG及双层PDF两种格式。

实际工作量有可能增加或者减少,增加或减少的工程量按照相关单价结算。

(2)数据格式与存储要求

a)满足国家档案行业标准《纸质档案数字化技术规范》(DA/T31-2005)。

b)投标方提交的加工成果是与广元市档案局目前使用的档案管理系统完全一一正确对应

的机读目录成品库和全文文件成品库。

c)投标方需提交存储级和利用级两套全文成品数据,数据必须达到以下所述质量控制技术

指标:

存储级:采用300dpi分辨率扫描,存储格式为真彩24位JPG。中标方提供光盘介质1

式3套。

利用级:采用300dpi分辨率扫描,存储格式为双层PDF,中标方提供光盘介质1式2套,且数据在采购人的相关服务器上线运行。

投标方提供的光盘介质要求采用单片盒装。

参数标准

本项目中提交的浏览级数据为双层PDF格式,需对扫描文件进行OCR识别,并生成双层PDF 格式文件,识别准确率要求在98%以上(手写体及非标准字库等无法识别的可存储为格式文件)。

1.1.3.3.扫描过程要求

A. 扫描时应根据纸质档案的材质选择相应的扫描设备,纸质较好的档案可采用滚筒等高

速扫描方式、纸质较薄、较脆的必须采用平板扫描方式。保证档案不受损伤,禁止使

用拍照方式。

B. 扫描时应认真登记扫描的页码和页数,并核对实际扫描页码、页数与前处理时填写的

页码、页数是否一致,不一致时应注明具体原因和处理方法。

C. 对案卷中漏编的页面进行合页处理,确保扫描好的影像页数与原案卷页数一致。

D. 同页有两个以上文件,需分别扫描处理。

E. 扫描全部采用彩色扫描,以扫描后的图像清晰、完整,档案内容信息与档案原件一致

为准,最大限度保持档案原貌。

F. 扫描参数如下:

彩色扫描分辨率采用300dpi或以上。

扫描时保证放纸端正、不压边、不漏扫、错扫、严格确保图像质量。

扫描中漏扫、压边的要即时补全、修正。

1.1.3.4.图像处理要求

A. 图像处理后保证图像信息与原档案内容完全一致,不删除页面任何有用信息,包括正

文内容、页眉、页脚、手写注释和印鉴等。扫描的页面内容基本居中显示,不出现明

显偏左或偏右现象。不准出现页面内容残缺或将其它页面信息扫入本页的现象。

B. 每页影像左右端正度控制在度以内,以达到视觉上基本不感觉偏斜为准。对方向不正

确的图像进行旋转还原,以符合阅读习惯。不出现图像的一部分出现倾斜或扭曲而影

响阅读的现象。厚的案卷装订线较近边角的档案内容会产生扭曲现象,需保证正文能

看清楚。

C. 去污:在保证文件内容完整的前提下,影像页无扫描过程中带来的污斑,无黑边,外

观达到清晰、平直、干净。对图像页面中出现的影响图像质量的杂质如黑点、黑线、

黑框、黑边等进行去污处理。处理过程中应遵循在不影响可读性和可理解性的前提下

展现档案原貌的原则,由于档案本身因陈旧、破损或不洁等造成页面上有污点的,如

果在页面视图下无法看清,或该污点嵌在文本行中无法清除,可不予清除。

D. 保证扫描图像字迹清晰、颜色恰当,不宜过浅或过深,不出现字迹笔画残缺或字迹笔

画叠合而影响阅读的情况,档案原件存在斑迹变质、颜色过浅、过深或深浅不一致,

保证档案原件能辨认的扫描图像也必须可以辨认。纸张太薄或字体颜色过浓,扫描时

倒映反面文字或文字上的污点无法去污时,应保证正文文字可以看清楚。

1.1.3.5.数字化流程要求

(1)在数字化加工过程中,需全程使用专业的数字化加工流程管理软件进行全过程管理监控;数字化流程至少应包括:出库、查卷、整理、条目着录、扫描、图像处理、质检、装订、数据备份、提交、还卷等。

(2)形成相应的员工操作记录,控制员工操作中的每一步,系统自动生成数据记录操作过程,随时检查任何工序的质量及完成情况,确保一次性达到成品质量要求。

1.1.3.6.数据安全要求

需要提供对关键数据影像的安全技术措施,采用技术手段对设备端口进行控制,对加工数据进行加密,实现档案数据拿不走、非法拷贝打不开,待移交正式成品数据时再进行解密,以实现事先防范。配合场地安全控制、设备安全控制、管理制度安全控制和人员安全控制手段,确保数字化加工过程中数据的安全。

1.1.3.7.图像数据命名方式

案卷级归档档案实体图像命名方式

图像数据分三层文件夹存放,第一层文件夹以全宗号命名,第二层文件夹以目录号命名,文件夹内存放该目录的所有卷,第三层文件夹以案卷级档号命名,文件夹内存放图像文件,图像文件以页码命名。

案卷级图像命名方式

件盒级归档档案实体图像命名方式

图像数据分三层文件夹存放,第一层文件夹以全宗号命名,第二层文件夹以目录号命名,文件夹内存放该目录的所有件,第三层文件夹以档号命名,文件夹内存放图像文件,图像文件以页码命名。

件盒级图像命名方式

1.1.3.8.时间项要求

目录数据中的时间项一律用8 位字符型(YYYYMMDD)表示,年、月、日无法确定补零充填。如为考证时间,应在备注项注明,时间项内不能有"? "、"()"等字符。

例1:1992年8月2日,着录为:

例2: 8月2日,年代不详。着录为:00000802

例3:1992年8月,日不详。着录为:

例4:1992年2日,月不详。着录为:

例5:1992年,月日均不详。着录为:

例6:如果年月日均不详,着录为:00000000

1.1.3.9.数据备份与提交

在数字化加工过程中,加工方应做好半成品数据(特别是原始扫描影像文件)和成品数据的存储备份工作。加工方自备存储设备,等项目验收数据提交完成后,中标单位收到数据提交明细验收清单后,方可将数据从备份载体中删除。

数据备份载体要求

数据采用两种载体装载;移动硬盘和DVD 光盘各一套,DVD 光盘要求为单片盒装。建议使用档案级光盘。

移交数据清单

加工方应提交硬盘数据和光盘数据移交清单,说明每张硬盘和光盘是什么数据以及移交数据总量,包括全宗号、目录数、案卷数、件数、页数、数据容量和移交数据的其它说明。

数据载体标识

每个硬盘或光盘都作标识,光盘盒正面及侧面标记盘号及内容,光盘盘片不可粘贴纸质标签,应采用标准涂层或记号笔书写,标识应反映出光盘内容。

1.1.3.10.数据验收

1.1.3.数据检查验收

目录数据验收质量要求

采用人工校对或软件自动校对的方式,对目录数据库的建库质量进行检查。以附录A 为标准,核对着录项目是否完整、着录内容是否规范、准确,对不合格的数据进行修改。详细要求见下表:

目录数据质量要求

序号质量项质量要求

1 条目划分可靠性符合DA/T22-2000中第节对“件”的要求和定义

2 着录项目真实性着录项目数据内容与档案原文内容相符

不存在异于原文的多余字、错别字、遗漏字

可靠性题名中的年度使用半角阿拉伯数字着录年度全称

着录规则、着录文字、着录用的数字及标示符应符合

DA/T18-1999的要求

不存在不明确的代称词,如“本局”“本单位”等容易引起误

解的简称

完整性标题应能反映档案内容,通过标题可以检索到该份档案。例如:

不能简单用“会议纪要”作为标题,应该根据内容“关于XXXX

的会议纪要”

对于标题不完整的情况,应增加副标题着录项补充完整。如“关

于XXXX等同志的任免通知”应在副标题或备注中将涉及到的其

他人员名称补充完整。

安全性作为公开信息查询的目录信息应该经过鉴定后开放,提供局域

网及政务网查询利用的目录信息不得涉及敏感信息。为保持查

询的完整性,可将敏感信息用****号隐去。未经解密的涉密档

案目录及原文应与各种网络物理隔离存放于涉密计算机上。

图像数据验收质量要求

图像数据中不能出现扫描格式错误、命名错误、歪斜、黑边、多扫、漏扫、扫描质量模糊等问题。具体要求见下表:

序号质量项质量要求

1 图像存储自洽性图像存储应遵循国家标准,黑白图采用TIFF、彩色图像采用JPG

等业内通用格式。网络利用可采用PDF或其他格式,如需全文

检索,可采用双层PDF格式。

同一个文件的所有图像存储在同一个磁盘文件夹下

未经解密的涉密文件的图像信息需单独保存在涉密机上,不得

提供网络利用。

2 视觉效果真实性图像文件的色彩、亮度、对比度等参数应接近或符合档案实体

历史原貌,不影响档案可读可懂性

图像文件顺序排列正确、不缺页

可靠性图像文件的清晰度应符合要求,在300DPI分辨率且放大到30%

的情况下看不到明显的污点和噪点

图像不能有黑边或歪斜现象,水平倾斜度小于1度

档案原件存在破损或装订压字等情况的应修复后再进行扫描。

无法修复的应保持档案原貌,并在备考表中注明。

挂接情况验收质量要求

数字化加工后的电子目录数据及图像文件必须进行挂接,建立相应的关联关系,挂接应通过软件程序使目录数据与图像文件一一对应。数据挂接应具有自洽性,具体要求见表三。

序号质量项质量要求

1 数据挂接自洽性挂接的图像的内容、页号和页数等信息应与目录信息保持一致

借助磁盘文件夹和文件命名进行关联的,其图像文件夹和文件

的命名应与相应目录数据的条目档号相匹配

1.1.3.验收方式

以抽检的方式检查已完成数字化转换的所有数据,包括目录数据库、图像文件及数据挂接的总体质量。

一个全宗的档案,数据验收时抽检的比率不得低于30%。

目录数据库与图像文件挂接错误,或目录数据库、图像文件之一出现不完整、不清晰、有错误等质量问题时,抽检标记为“不合格”。

一个全宗的档案,数字化转换质量抽检的合格率达到95%以上(含95%)时,给予以验收“通过”。但部分重要档案的一次抽检合格率应达到98%以上(含98%).

合格率=抽检合格的文件数/抽检文件总数×100%

验收"通过"的结论,必须经分管领导审核、签字后方有效。

1.2电子档案信息系统改造

(1)依托现有档案管理系统建立案卷级目录中心、文件级目录中心、原文数据库、照片数据库、专门档案数据库、声像档案数据库等六大数据库。

(2)在现有档案管理系统的基础上增加电子阅览室系统和利用计费系统。

(3)增加电子档案离线移交和接收工具,实现各立档单位案卷级和文件级数据的着录、导入、批量修改、原文挂接功能。电子文件命名不符合规范时,应具备按档号自动修改文件名功能。待移交的电子档案数据进入离线移交工具后,此工具能生成符合档案局接收规范的移交包,并顺利接收。

(4)局域网系统应具有多级审批流程、数据加密、电子档案防篡改机制、档案分类和着录项自定义等功能。

(5)系统应具备插删卷功能、文件辅助鉴定、自动生成档号、自动拆分档号功能、具备档案编研功能,编研成果以电子书形式展现。

(6)投标人应独立免费提供纸质档案管理系统一套,用于招标人对实物纸质档案管理。1.2.1其他说明

(1)我局可以为数字化加工工作提供加工场地。数字化加工所需的设备和耗材等,需要项目中标方负责提供。

(2)投标商需自备档案数字化加工必要的专业技术和相应的软硬件设备进场加工。

(3)针对本项目需求提出完整的解决方案,提出纸张质地状况较差档案扫描的实现方法,确保较薄纸张(如信纸、便笺纸)、破损纸张、底灰较深(如草浆纸、油印纸)、字迹较浅(如铅笔字迹)等纸张质地状况较差的档案扫描图像清晰,又不损伤档案原件。

(4)提供档案加工作业流程控制方案、设备及人员配置,质量控制及差错防范措施。申请人须在投标方案中明确加工场地规划,说明所配备的硬件数量及规格,软件和网络环境。

(5)投标人必须在投标文件中明确数字化加工现场的安全、保密、人员管理制度。

(6)确保在扫描过程中不对档案原件造成二次损伤。

(8)中标单位需要采用专业的档案数字化流程管理系统来对本次项目中涉及的所有数字化加工流程进行管理。

(9)投标人提交的档案数字化加工后的档案数据必须与现有系统对接,投标人应提供加工后的档案数据与现有系统成功对接的案例或取得原厂商的技术支持授权或投标人承诺函,若中标还应在合同签署前进行实际操作验证,若无法在规定时间内实现加工后的数据导入、批量挂接到现有档案系统,招标方有权取消其中标资格。

(10)项目完成时间: 150 (工作日)

(11)项目完成数量:200 万页

纸质档案数字化的基本流程及技术要求

纸质档案数字化的基本流程及技术要求 一、概述 档案是人类社会实践活动的真实记录,是党和国家宝贵的历史文化财富。这些具有查考凭证作用、依据作用和参考作用的档案,是人们从事科研、生产等工作的必要条件和有力工具。档案也是各企事业单位运作各个环节的真实记录,是极其珍贵的原始资料和重要的信息资源。准确、系统、完整的档案是单位工作的重要参考资料,是社会的重要财富。 随着计算机技术、扫描技术、OCR技术、数字摄影技术(录音、录像)、数据库技术、多媒体技术、存储技术的发展而产生的一种新型档案信息形态,它把各种载体的档案资源转化为数字化的档案信息,以数字化的形式存储,网络化的形式互相连接,利用计算机系统进行管理,形成一个有序结构的档案信息库,及时提供利用,实现资源共享。档案数字化是数字档案建设最基础的工作,传统载体的档案经高科技技术加工成数字档案形式,通过局域网、政务网、互联网进行计算机检索、阅读电子档案,为迎接档案信息服务新环境的挑战,提高管理水平、提高效率,增强档案业务部门的服务水平,为档案内部管理及面向客户服务提供高效率的全面服务。档案作为一种原生信息资源,其重要性正日益凸显出来,逐步掌握信息技术为档案工作服务,为社会主义经济建设服务,为社会主义精神文明建设服务。 二、基本原则 纸质档案数字化的基本原则是使档案信息资源准确方便快捷地提供利用,使可以公开的档案信息资源得到共享,以满足社会对档案利用的需求。属于归档范围且应永久或长期保存的、社会利用价值高的档案可列入数字化加工的范围,并按照《中华人民共和国行业标准(DA/T 31—2005)纸质档案数字化技术规范》对纸质档案进行数字化。根据档案幅面的大小(如A4、A3、A0等)选择相应规格的扫描仪或专业扫描仪,如工程图纸采用0号图纸扫描仪进行扫描。纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式以提高工作效率。扫描过程中,确保不对档案原件造成破坏,保证档案扫描图像与原件一致、整洁、清晰。加强对纸质档案数字化各环节的安全保密管理机制,确保档案原件和数字化档案信息的安全。 三、基本流程及技术要求 纸质档案数字化的基本环节主要包括:档案整理、档案扫描、图像处理、图像存储、

档案数字化加工流程及

档案数字化加工流程及规范 文档目录 一、操作流程 (2) 二、档案调卷 (2) 三、整理及著录 (2) 四、拆卷 (3) 五、档案扫描 (3) 六、影像处理 (4) 七、数据质检 (4) 八、档案装卷 (4) 九、完整归还 (5) 十、数据备份 (5) 八、数据挂接 (5)

、操作流程 档案数字化加工业务总体流程包括:档案调卷、整理及著录、拆卷、档案扫描、影像处理、数据质检、档案装卷、完整归还、数据备份、数据挂接。 先后顺序为:调卷> 著录> 拆卷> 扫描> 处理> 质检> 装卷> 归还> 备份> 挂接。没有特殊要求的情况下,务必安此流程进行操作,以便从总体任务中提高工作效率。 二、档案调卷 这个过程我方要指定一个专门的负责人与客户(档案馆库房管理员)共同完成,将待加工的档案从库房搬运到加工现场,对档案要逐份清点,并办理档案交接登记,与客户做好交接记录,确定无误后方可进行拆卷环节的工作。要求:1,我方指定专人负责。 2,填写《档案交接登记表》(附件一)。 3,在交接登记表上要有双方的签字。 三、整理及著录 档案目录的整理是数字化加工工作的前提条件,如果没有正确的档案目录,会给后序工作带来很大麻烦,所以在数字化加工之前必须有完整且正确的档案目录。 对于待加工的档案,要制作电子目录。制作途径有两种: (一),使用数字化加工软件的数据录入功能,进行目录制作。 (二),使用Excel表格方式制作,目录模板使用《档案目录模板》文档(文档号为JS121006002。 如果用户提供的有纸质目录或电子目录,我方要认真核对有无错漏现象,找出错误并修正。并修改成与《档案目录模板》类似的字段标准。对于错误或疏漏的修正,具体细则如下: 1,如果用户提供的目录和纸质档案不对照的,应该以纸质档案原文内容为标准进行录入,并删除错误信息。 2,著录项相关内容录入要完整,如有不明确或不完整的著录项需记录并及时反应给组长,如果目录中要增加或减少相关著录字段,要与客户协商,并及时向公司技术部反馈。以下著录项必不可少,且与纸质档案要一一对 照: 八、、? 以“卷”为管理单位的年度、期限、卷号、题名、卷内文件序号、卷内文件题名、卷内文件页号等。以“件”为管理单位的年度、期限、件号、页数、题名等。 3,如果目录内容有错(如主题内容,文号等),以纸质档案信息为准,并及时反应给组长,由组长与客户协商解决。 4,如遇到较少见的繁体字或不清晰的字体,需向组长反应,不允许擅自解决,所有的繁体字在录入时应录入为简体字。 5,如遇到无题名的档案,及时记录下来,反应给客户协商解决

DA/T32005纸质档案数字化技术规范标准

纸质档案数字化技术规范DA/T31-2005 1 范围 本标准规定了纸质档案数字化的主要技术要求。 本标准适用于用扫描仪对各种纸质档案的数字化加工处理。 2 规范性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 GB/T 17235.1 连续色调静态图像的数字压缩编码 GB/T 17235.2 连续色调静态图像的数字压缩编码 GB/T 18894?2002 电子文件归档与管理规范 ITU(CCITT)G3 二值图像压缩算法 ITU(CCITT)G4 二值图像压缩算法 DA/T18?1999 档案著录规则 档案管理软件功能要求暂行规定国家档案局档发[2001]6号 3 术语和定义 下列术语和定义适用于本标准。 3.1 数字化 Digitization 用计算机技术将模拟图像转换为数字图像的处理过程。 3.2 纸质档案数字化Digitization of Paper?Based Records 对普通(黑色字迹清晰)的油印、铅印、胶印等印刷件或复印件纸质档案进行数字化及应用的过程。

3.3 数字图像 Digital Image 表示景物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样一连续函数,并在采样点上将值最小化后的阵列。 3.4 黑白二值图像 Binary Image 只有黑白两级灰度的数字图像。它对应于黑和白的两种状态文字稿、线条图、指纹图等。 3.5 连续色调静态图像 Continuous?tone Still Image 以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字 图像。 3.6 失真度 Distortion Measure 对档案原件进行数字化转换后,在同等测试环境下,数字图像与档案原 件色彩、几何、压缩算法等差值。 3.7 可懂度 intelligibility 表示数字图像向人或机器提供信息的能力。 3.8 清除图像冗余或对图像近似的任一种过程,其目的是对图像以更紧凑的形式表现。 3. 9 分辨率Resolution

纸质档案数字化技术标准

纸质档案数字化技术标准 1范围 本标准规定了纸质档案数字化的主要技术要求。 本标准适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。 2规范性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 GB/T 17235 .1-1998信息技术连续色调静态图像的数字压缩及编码第1部分:要求和指南 GB/T 17235.2-1998信息技术连续色调静态图像的数字压缩及编码第2部分:一致性测试 GB/T 18894 - 2002电子文件归档与管理规范 3术语和定义 下列术语和定义适用于本标准。 3.1数字化 用计算机技术将模拟信号转换为数字信号的处理过程 3.2纸质档案数字化 采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数

字图像或数字文本的处理过程。 3.3数字图像 表示实物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样——连续函数,并在采样点上将值最小化后的阵 列。 3.4黑白二值图像 只有黑白两级灰度的数字图像。它对应于黑白两种状态的文字稿、线条图等。 3.5连续色调静态图像 以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。在纸质档案数字化过程中,通常表现为灰度扫描和彩色扫描两种模式。 3.6分辨率 单位长度内图像包含的点数或像素数,一般用每英寸点数( dpi)表示。 3.7失真度 对档案进行数字化转换后,数字图像与档案原件在色彩、几何等方面的偏离程度。 3.8可懂度 数字图像向人或机器提供信息的能力。 3.9图像压缩 清除图像冗余或对图像近似的任一种过程,其目的是对图像以更紧凑的形式表示。纸质档案数字化过程中,较常见的有TIFF (G4)、

档案数字化加工流程

档案数字化加工流程 档案数字化加工业务总体流程包括:档案调卷、整理及著录、免拆卷、档案扫描、影像处理、数据质检、完整归还、数据备份、数据挂接。 先后顺序为:调卷> 著录 > 扫描> 处理> 质检 > 归还> 备份> 挂接。在之前的档案管理数字化就是需要拆卷的,但就是现在有专业的非接触式扫描设备(比如book2net与iscan系列的产品)可以免拆卷,这就省去了很多的人力物力。下面介绍详细的步骤: 档案调卷 这个过程我方要指定一个专门的负责人与客户(档案馆库房管理员)共同完成,将待加工的档案从库房搬运到加工现场,对档案要逐份清点,并办理档案交接登记,与客户做好交接记录,确定无误后方可进行拆卷环节的工作。 整理及著录 档案目录的整理就是数字化加工工作的前提条件,如果没有正确的档案目录,会给后序工作带来很大麻烦,所以在数字化加工之前必须有完整且正确的档案目录。 对于待加工的档案,要制作电子目录。制作途径有两种: (一),使用数字化加工软件的数据录入功能,进行目录制作。 (二),使用Excel表格方式制作,目录模板使用《检察机关档案目录模板》文档(文档号为JS121006002)。 如果用户提供的有纸质目录或电子目录,我方要认真核对有无错漏现象,找出错误并修正。并修改成与《检察机关档案目录模板》类似的字段标准。对于错误或疏漏的修正,具体细则如下: 1,如果用户提供的目录与纸质档案不对照的,应该以纸质档案原文内容为标准进行录入,并删除错误信息。

2,著录项相关内容录入要完整,如有不明确或不完整的著录项需记录并及时反应给组长,如果目录中要增加或减少相关著录字段,要与客户协商,并及时向公司技术部反馈。以下著录项必不可少,且与纸质档案要一一对照: 以“卷”为管理单位的年度、期限、卷号、题名、卷内文件序号、卷内文件题名、卷内文件页号等。 以“件”为管理单位的年度、期限、件号、页数、题名等。 3,如果目录内容有错(如主题内容,文号等),以纸质档案信息为准,并及时反应给组长,由组长与客户协商解决。 4,如遇到较少见的繁体字或不清晰的字体,需向组长反应,不允许擅自解决,所有的繁体字在录入时应录入为简体字。 5, 如遇到无题名的档案,及时记录下来,反应给客户协商解决。 6,关于顺页;整理著录的同时,检查案卷的完整性,就是否有缺页、漏页、错编现象,正、副卷标注就是否正确,有问题及时反馈。没有问题时,用2B铅笔对纸质档案内容进行标注页码,正面标注在右上方,背面标注在左上方,页码字体工整、大小适中。 7,关于分卷问题;档号保持不变,卷号采用“卷号-卷次”格式,如0025-1、0025-2、0025-3……0025-12、0025-13;如果纸质档案分多卷,但就是客户没有分卷次的,我们要重新编卷次,增加一条案卷目录,每个分卷都要对应一条案卷目录(不能两个分卷对应一个目录)。 8,关于补卷问题;漏归档的档案作为补卷插入时,卷号要以实际的纸质档案的卷号为准。如0025-1、0025-A、0025-补、0025A等,我们做目录时当保持不变。 9,档号、卷号、件号、页号中不能出现正反斜杠(\ ,/),如果发现要改成中划线(-)(注意:中划线录入时,要使用英文输入法下的半脚录入),日期格式统一采用8位数字,如20120206,不足8位时补0。 档案扫描

档案数字化加工项目实施计划方案

新都建设局档案数字化加工项目 实施方案 目录 一、项目概述............................................................................................................ 错误!未定义书签。 1、项目需求分析.......................................................................................... 错误!未定义书签。 1.1档案内容及数量(现场调研)............................................. 错误!未定义书签。 1.2档案数字化环节及质量要求.................................................. 错误!未定义书签。 1.3档案验收.............................................................................................. 错误!未定义书签。 1.4档案安全要求................................................................................... 错误!未定义书签。 二、项目实施准备................................................................................................. 错误!未定义书签。 1、设备配套........................................................................................................ 错误!未定义书签。 2、人员配备........................................................................................................ 错误!未定义书签。 三、项目实施............................................................................................................ 错误!未定义书签。 1、总体实施原则............................................................................................. 错误!未定义书签。 2、人员岗位安排............................................................................................. 错误!未定义书签。 3、项目实施流程............................................................................................. 错误!未定义书签。 3.1档案借出.............................................................................................. 错误!未定义书签。 3.2档案整理排序分卷........................................................................ 错误!未定义书签。 3.3档案录入.............................................................................................. 错误!未定义书签。 3.4整理环节检查................................................................................... 错误!未定义书签。

《纸质档案数字化技术规范》(DAT 31-2005)

《纸质档案数字化技术规范》(DAT 31-2005)《纸质档案数字化技术规范》(DA/T 31-2005) (2008-05-07 12:48:46) (中华人民共和国档案行业标准 DA/T 31-2005,中华人民共和国国家档案局2005年4月30日发布,2005年9月1日起实施) 1 范围 本标准规定了纸质档案数字化的主要技术要求。 本标准适用于用扫描仪对各种纸质档案的数字化加工处理。 2 规范性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 GB,T 17235.1 连续色调静态图像的数字压缩编码 T 17235.2 连续色调静态图像的数字压缩编码 GB, GB,T 18894—2002 电子文件归档与管理规范 ITU(CCITT)G3 二值图像压缩算法 ITU(CCITT)G4 二值图像压缩算法 DA,T18—1999 档案著录规则 档案管理软件功能要求暂行规定国家档案局档发[2001]6号 3 术语和定义 下列术语和定义适用于本标准。 3.1数字化 Digitization

用计算机技术将模拟图像转换为数字图像的处理过程。 3.2纸质档案数字化Digitization of Paper—Based Records 对普通(黑色字迹清晰)的油印、铅印、胶印等印刷件或复印件纸质档案进行数字化及应用的过程。 3(3数字图像 Digital Image 表示景物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样一连续函数,并在采样点上将值最小化后的阵列。 3(4黑白二值图像 Binary Image 只有黑白两级灰度的数字图像。它对应于黑和白的两种状态文字稿、线条图、指纹图等。 3(5连续色调静态图像 Continuous—tone Still Image 以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。 3(6失真度 Distortion Measure 对档案原件进行数字化转换后,在同等测试环境下,数字图像与档案原件色彩、几何、压缩算法等差值。 3(7 可懂度 intelligibility 表示数字图像向人或机器提供信息的能力。 3(8清除图像冗余或对图像近似的任一种过程,其目的是对图像以更紧凑的形式表现。 3. 9分辨率 Resolution 指单位长度内图像包含的点数或像素数。 3.10 TIFF Tagged Tmage File Format 标记图像文件格式。一种基于标记的无损(不丢失信息)压缩格式,用于在应用程序之间和计算机平台之间交换文件。因为它存储图像细微层次的信息非常多,图像的质量也得以提高,故而非常有利于原件为黑 白档案的复制储存。 JPEG Joint photographic Experts Group 3.11

档案数字化加工操作细则

档案数字化加工操作细则 为确保本馆馆藏档案数字化加工的安全管理和质量控制,根据国家档案局和本局有关档案数字化的规定和标准,按照本馆档案数字化 加工工作流程,特制定本操作细则。 本细则对档案数字化加工的主要工作环节包括:档案实体交接、目录审核修改、扫描前处理、档案扫描、图像处理、图像质检、数据挂接、档案装订、数据验收、数据备份、档案归还等,提出操作要求,并在整个工作环节中确保档案实体及其信息的安全保密。 一、档案实体交接档案实体交接分为档案领取、档案归还、档案存放三个环节,由本馆档案数字化中心和承担本馆档案数字化的服务 机构、监理公司三方指定管理人员完成。 (一)档案领取 1. 按照馆藏档案数字化加工项目计划,服务机构根据工作进度以及加工能力,提出档案领取申请,经监理公司审核后,向本馆档案数 字化中心管理员递交,由档案数字化中心管理员负责向收集保管处提 出需要加工档案的全宗、年份、保管期限、目录号、案卷号,库房管 理人员按需求调卷,清点、核实无误后办理档案出库登记手续。 2. 出库档案进入档案数字化中心,数字化中心管理员与监理公司、 服务机构管理人员共同清点、核对该批次档案的范围、数量,确 认无误后,应填写《档案交接记录表》,并经三方签字确认。 3. 接收的档案有错误之处立即核查更正,并打印出勘误表请档案数字化中心管理员确认后再进行档案整理等工作。

4. 加工人员按档案的档号排列顺序依次向服务机构管理人员领取档案,确认加工内容并签字。 5. 加工完毕后,加工人员将档案退还服务机构管理人员,由管理人员确认签字。 (二)档案归还 1. 同一批次出库的档案在完成数字化加工并经由数字化中心管理人员质检抽查合格后,服务机构管理人员按《档案交接记录表》,确定应归还档案的档号(全宗号、年份、保管期限、目录号、案卷号)和数量,并检查档案的完整性。 2. 将档案按出库时的排列顺序排列。 3. 监理公司对服务机构提出归还的档案进行清点、检查档案的完整性,确认无误后向数字化中心提出归还建议。 4. 数字化中心与监理公司、服务机构管理人员现场清点并抽查档案的完整性情况,三方确认无误后在《档案交接记录表》签字确认。 5. 档案数字化中心管理员负责向收集保管处归还档案,办理档案归库手续。 (三)档案存放 1. 数字化加工档案一律统一存放在临时库房,下班后不能留存在加工位及加工区域。 2. 每天上、下午上班后,由数字化中心、监理公司、服务机构按当日数字化加工范围,共同到临时库房运送档案到加工中心,下班后提前10 分钟清点出库加工档案,将加工档案返回临时库房存放。

纸质档案数字化加工项目验收管理暂行办法

纸质档案数字化加工项目验收管理暂行办法 1总则 1.1为了规范纸质档案数字化加工项目验收管理,确保档案安全和项目质量达到有关要求和标准,特制定本办法。 1.2本办法适用于广西各级党政机关、人民团体。 2对象、依据及前提条件 2.1各级档案行政管理部门根据相关规定接受本级行政区域内业主单位委托组织纸质档案数字化加工项目的验收。 2.2依据档案数字化加工项目合同书、合同附件、有关技术说明文件及规范的验收资料,按照国家和地方的相关法律、法规、国家标准、行业标准、地方标准进行验收。 2.3项目验收的前提条件 2.3.1项目按照合同要求全部完成,并满足使用要求; 2.3.2各个分项全部预验收合格; 2.3.3已通过自治区档案局指定软件综合应用测试;2.3.4各种验收资料完备,符合合同内容; 2.3.5经过相关主管部门和项目业主同意; 2.3.6合同或合同附件规定的其他验收条件。 3验收内容

3.1分项验收:对纸质档案数字化加工项目分项进行验收,包括档案整理、档案扫描、图像处理、图像存储、目录建库、数据挂接、数据备份等。验收以抽检的方式检查已完成数字化加工的所有档案和数据,抽检的比率不得低于档案和数据总量的5%。 3.2验收指标:以下分项抽检标记为“不合格”:未按数字化加工要求拆装、处理档案,档案破损、页码顺序错误、页数不清、目录不实;扫描档案技术指标错误,扫描、处理图像文件不完整、不清晰、不反映档案原貌以及有缺页、漏页、重页、顺序颠倒等质量问题;图像文件存储格式、命名未按规范要求;目录建库数据格式不符合规范要求,著录项目不全、内容不准确规范,不能与图像数据库批量、快速挂接以及数据挂接错误的;数据备份不当造成数据丢失、错误,成品数据未进行多套备份。 验收抽检的合格率达到95%以上(含95%)时,予以验收“通过”。 合格率=合格的文件数/被抽检文件总数×100%。 4验收程序 4.1验收程序 4.1.1预验收

缩微胶片档案数字化技术规范

缩微胶片档案数字化技术规X (征求意见稿) 1 X围 本标准规定了缩微胶片档案数字化的主要技术要求。 本标准适用于缩微胶片档案进行数字化及数字化成果的管理。 2 规X性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 DA/T18-1999 档案著录规则 GB/T 18894-2002 电子文件归档与管理规X DA/T 31—2005 纸质档案数字化技术规X 3 术语和定义 下列术语和定义适用于本标准。 3.1 数字化digitization 用计算机技术将模拟信号转换为数字信号的处理过程。 3.2 缩微胶片档案 microfilm records 记录了档案缩微影像的微粒高解像力的胶片。 3.3 缩微胶片档案数字化digitization of microfilm records 采用缩微胶片扫描仪等设备将缩微胶片上的影像转换为存储在磁盘、磁带、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。 3.4 密度density 在缩微摄影技术中衡量感光材料曝光和显影后变黑程度的物理量,也可用透射密度(D т)来表示,定义为不透明度的基10对数。即: Dт = log10 (1 / て)= log10( Ii / It ) Dт——透射密度

て——透射率,て =( It / Ii ) Ii ——光能 It ——透射光 3.5 解像力 resolution 衡量胶片影像细部能力的物理量,解像力的高低通常以在每毫米胶片上所能分辨的最大线条对数来表示。 3.6 对比度contrast 表示影像中明暗区域相互关系,是影像中最亮与最暗的色调之间差异X围的指数。高对比度可以使数字图像在黑白之间具有较少的灰色层次并且显示出较少的细节,低对比度具有更多的灰度层次及细节。 3.7 曝光亮度 exposure brightness 是决定数字图像明暗强度的指数。高曝光亮度可以使数字图像的色度加深并显示出较多的细节,可以突出浅色信息的痕迹,同时黑白之间出现的底灰加大。 4 基本要求 4.1 基本原则 保护档案原件,减少数字化工作环节,提高工作效率,使档案信息资源方便快捷地提供利用,使可以公开的档案信息资源得到共享,以满足社会对档案利用的需求。 4.2 数字化对象的确定原则 4.2.1应确认档案的内容可以进行数字化。 4.2.2 应确认缩微胶片影像质量符合本规X5。 4.2.3 应选择第二代或第三代缩微胶片进行数字化。 4.3 基本环节 缩微胶片档案数字化的基本环节主要包括:缩微胶片检查、缩微胶片档案整理、缩微胶片档案扫描、图像处理、图像存储、目录建库、数据挂接、数据验收、数据备份、成果管理等。 4.4 过程管理 4.4.1 应加强对缩微胶片档案数字化各环节的安全XX管理措施,确保档案的安全。 4.4.2应对缩微胶片档案数字化各个环节的工作状况进行记录,并及时将记录的文字、表格等整理、汇总、装订成册。在缩微胶片档案数字化的同时建立起完整、详细的工作记录,便于查询、数据管理和数据移交。 5 缩微胶片检查

(完整)2019-2020年整理档案数字化加工方案汇编,推荐文档.docx

档案室、档案馆 馆藏档案扫描、数字化加 工整体解决方案

目录 第一数字化加工作前期准?????????1 一、数字化工作人准???????????1 二、数字化工作件、硬件准????????4 三、确定数字化内容、数量及用需求?????5 第二数字化加工流程及主要技方案???????6 一、入提卷、拆卷?????????????6 二、引著????????????????7 三、档案描????????????????8 四、像理????????????????11 五、全文 OCR、生成双 pdf、板式原及格式? 12 六、?????????????????14 七、批量挂接????????????????15 八、卷及数据份提交???????????15 第三量控制方案和保措施??????????17 一、加工量保障措施???????????17 二、多,多次的量体系?????17 三、段性收与相合的格收程序是量控制的 保障????????????????19 第四安全保密控制??????????????? 21

保密????????????????? 22 第五售后服?????????????????24 项目背景 —————————————————— 随着全国文化信息源共享工程与中国数字工程的起,信息化已成国潮流,信息源建成当之急。信息源建的重点是子文献、各数据、网源、子档案、子等新型数字化信息源的建。 在数字化信息源建中,很大的一个需求是将有的介印刷品数字化, 使之成能用算机、理解、、索的子文件,最将其用于 数据存,或通CD-ROM、Internet网行出版,或上数字档案供用 使用。 以体的保存方式,占据了大量的空,需要特殊的境,而且不方便,随 着的推移,面着腐、老化等。而将介文件信息行子化理,保存到光上,具 有存、管理、共享等功能,可以减少文件房占地,省保管和人方面开支,又方 便和行程。 因此,将档案、期刊、文件等料通描,描成像文件,再通理成子文档, 建立目和索引,制作成子文件,已是当之急。

档案数字化加工方案计划

(三)数字化加工部分 (2) 6.1.需求分析与总结 (2) 6.2.参考的国家标准及技术规范 (2) 6.3.数字化加工实施细则 (3) 6.9.1.本项的扫描加工流程 (3) 6.9.2.生产流程有以下几个主要的步骤组成: (4) 6.9.3.档案整理 (5) 6.9.4.著录标引 (6) 6.9.5.纸件扫描 (7) 6.9.6.图像处理 (8) 6.9.7.质量检验 (10) 6.9.8.档案还原装订 (10) 6.9.9.数据存储与备份 (12) 6.9.10.档案电子数据与XXXXXX烟草档案系统的无缝挂接 (12) 6.4.项目所采用的OCR处理技术介绍 (12) 6.10.1.OCR(光学字符识别)技术 (12) 6.10.2.所采用的OCR及双层PDF生产流程 (13) 6.10.3.生产流程逻辑示意图 (14) 6.5.XXXXXX档案数字化服务特点 (15) 6.11.1.自动化程度高 (15) 6.11.2.标准化程度高 (15) 6.11.3.严格的质量控制 (15) 6.11.4.文档安全性高 (15) 6.11.5.标准的格式 (15) 6.11.6.方便存储与管理 (16)

(三)数字化加工部分 6.1.需求分析与总结 此次项目是将中国烟草总公司XXXXXX省公司及所属11个市烟草公司的约183万页纸质档案进行数字化加工并将成品数据挂接到档案管理系统中,纸质档案的折分整理、扫描与图像处理、数据的挂接与光盘备份都将严格按照国家档案局相关标准及XXXXXX省档案局相关规定,结合XXXXXX烟草档案现状定制加工技术规范与生产加工流程。 。据上述现状,具体人员安排,项目实施周期,采用标准及实施细则如下。 6.2. 参考的国家标准及技术规范 《纸质档案数字化技术规范》(DA/T 31—2005) 《连续色调静态图像的数字压缩及编码》(GB/T 17235.1-1998) 《电子文件归档与管理规范》(GB/T 18894-2002) 《中央档案馆接收档案的标准》 《XXXXXX省档案接收和收集管理相关规定 《归档文件整理规则》(DA/T22-2000) 《档案著录规则》(DA/T 18-1999) 《无酸档案卷皮卷盒用纸及纸板》(DA/T 24-2000) 《档案修裱技术规范》(DA/T 25-2000) 《XXXXXXXXXXXX档案数字化技术规范》 《XXXXXX烟草档案数字化技术规范》

纸质档案数字化技术规范

纸质档案数字化技术规范 Specification for Digitization of Paper-Based Records 1 范围 本标准规定了纸质档案数字化的主要技术要求。 本标准适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。 2 规范性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 GB/T 17235.1 连续色调静态图像的数字压缩编码第一部分:要求和指南 GB/T 17235.2 连续色调静态图像的数字压缩编码第二部分:一致性测试 GB/T 18894 电子文件归档与管理规范 3 术语和定义 下列术语和定义适用于本标准。 3.1 数字化digitization 用计算机技术将模拟信号转换为数字信号的处理过程。 3.2 纸质档案数字化digitization of paper-based records 采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。 3.3 数字图像digital image 表示实物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样——连续函数,并在采样点上将值最小化后的阵列。 3.4 黑白二值图像binary image 只有黑白两级灰度的数字图像。它对应于黑白两种状态的文字稿、线条图等。

档案数字化项目投标技术方案设计

一、项目实施方案 (一)项目实施的依据 1、《中华人民共和国档案法》 2、《机关文件材料归档范围和文书档案保管期限规定》(国家档案局第8号令) 3、国家档案局《CAD电子文件光盘存储、归档与档案管理要求》GB/T17678.1—1999 4、《归档文件整理规则》》(DA/T 22—2015) 5、《档案著录规则》(DA/T18-1999)。 6、《纸制档案数字化技术规范》(DAT-31-2017) 7、《电子文件归档与管理规范》GB/T18894—2002 (二)项目实施前准备 1、人员准备 (1)甲方人员 职务:现场交接管理人员 职责:①负责与乙方的档案提卷和还卷等交接工作,协同甲方人员作好交接清单记录并签字。②负责监督乙方规范化加工。③随时把握乙方加工进度并进行协调。④及时关注并抽查乙方加工质量。⑤代表甲方与乙方进行及时的沟通及问题协调,确保项目顺利完工。(2)乙方人员 2.1 管理人员:主要为熟悉现场加工管理,熟悉数字化整体作业流程,具有较强组织能力和现场管理及沟通能力的乙方负责人。 2.2 工程技术人员:主要为熟悉计算机软、硬件技术,了解档案数据库标准和系统开发。了解档案管理等相关专业知识的乙方技术支持工程师。 2.3 数据采集作业员:主要为了解档案数据库数据标准和计算机软件应用等相关知识的乙方数字化制作工作人员

2、项目设备设施准备 (1)主要加工设备及其技术参数

数字化加工过程中使用的数字化加工管理软件,是档案数字化加工的主要应用工具,也是确保档案数字化加工工作效率和成果质量的关键技术。档案数字化加工软件必须具有扫描、图像处理、著录、校对、质检、自动挂接、查询检索、数据转换、数据上传、数据统计、打印传输等功能,能够满足档案数字化加工全流程各业务环节的需要,以及对加工数据进行质量检查和验收的需要。 (3)其他辅助加工设备 除上述主要加工设备外,在档案数字化加工现场,还需要配备以下辅助设备:办公桌椅、档案存储柜、储物柜、装订机、电熨斗、切纸机、抽湿机、碎纸机以及纸张、档案卷皮、档案盒、装订线、胶水等消耗材料。具体参照招标文件要求或合同约定配置。 3、场地部署准备 (1)各单位应配备专用的数字化加工场地,并进行合理布局,形成档案存放、数字化前处理、档案著录、档案扫描、图像处理、质量检查等工作区域。一般设在档案部门独立、可封闭的建筑内。 (2)数字化加工场地应符合防盗、防火、防尘、防水、防潮、防高温、防日光及紫外线照射、防有害生物、防污染等安全管理要求。场地内应配备可覆盖全部场地的报警、防火等应急设施设备。 (3)数字化加工场地应配备满足安全管理需要的视频监控设备,确保档案暂存处、数字化加工工位、服务器、数据导出端及门窗等无监控死角;视频监控数据自产生之日起保存不少于6个月,涉密档案数字化加工监控录像要保存到项目完工数据移交1个月后;档案部门应定期对视频监控数据进行回放检查,在删除视频监控数据之前,要留存视频回放安全检查记录。 (4)数字化加工场地应配备符合国家标准并满足工作需要的档案装具,用于分别存放待数字化处理和已数字化处理的档案。 (5)各单位和数字化服务机构应合理规划、配备和管理档案数字化设施设备,确保设施设备安全、先进,能够满足数字化工作的需要。 (6)数字化加工场地须封断所有档案数字化加工设备的无线网络功能以及非必要的各终端接口,各单位和数字化服务机构应定期进行相关检测。如有必要,应由县档案局构建数字化加工专用局域网和视频监控专用网。

档案数字化加工流程

档案数字化加工流程-标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

档案数字化加工流程 档案数字化加工业务总体流程包括:档案调卷、整理及著录、免拆卷、档案扫描、影像处理、数据质检、完整归还、数据备份、数据挂接。 先后顺序为:调卷 > 著录 > 扫描 > 处理 > 质检 > 归还 > 备份 > 挂接。在之前的档案管理数字化是需要拆卷的,但是现在有专业的非接触式扫描设备(比如book2net和iscan系列的产品)可以免拆卷,这就省去了很多的人力物力。下面介绍详细的步骤: 档案调卷 这个过程我方要指定一个专门的负责人与客户(档案馆库房管理员)共同完成,将待加工的档案从库房搬运到加工现场,对档案要逐份清点,并办理档案交接登记,与客户做好交接记录,确定无误后方可进行拆卷环节的工作。 整理及著录 档案目录的整理是数字化加工工作的前提条件,如果没有正确的档案目录,会给后序工作带来很大麻烦,所以在数字化加工之前必须有完整且正确的档案目录。 对于待加工的档案,要制作电子目录。制作途径有两种: (一),使用数字化加工软件的数据录入功能,进行目录制作。 (二),使用Excel表格方式制作,目录模板使用《检察机关档案目录模板》文档(文档号为JS2)。 如果用户提供的有纸质目录或电子目录,我方要认真核对有无错漏现象,找出错误并修正。并修改成与《检察机关档案目录模板》类似的字段标准。对于错误或疏漏的修正,具体细则如下: 1,如果用户提供的目录和纸质档案不对照的,应该以纸质档案原文内容为标准进行录入,并删除错误信息。 2,著录项相关内容录入要完整,如有不明确或不完整的著录项需记录并及时反应给组长,如果目录中要增加或减少相关著录字段,要与客户协商,并及时向公司技术部反馈。以下著录项必不可少,且与纸质档案要一一对照:以“卷”为管理单位的年度、期限、卷号、题名、卷内文件序号、卷内文件题名、卷内文件页号等。

档案数字化加工方案

档案室、档案馆 馆藏档案扫描、数字化加工 整体解决方案 目录 第一节质数字化加工作业前期准备 (1) 一、数字化工作人员准备 (1) 二、数字化工作软件、硬件准备 (4) 三、确定数字化内容、数量及用户需求 (5) 第二节数字化加工流程及主要技术方案 (6) 一、入库提卷、拆卷 (6) 二、标引着录 (7) 三、档案扫描 (8) 四、图像处理 (11) 五、全文OCR、生成双层pdf、板式还原及格式 (12) 六、总质检 (14) 七、批量挂接 (15) 八、还卷及数据备份提交 (15) 第三节质量控制方案和保证措施 (17) 一、加工质量保障措施 (17) 二、多环节,多层次的质量检查体系 (17) 三、阶段性验收与终验相结合的严格验收程序是质量控制的终级保障 (19)

第四节安全保密控制 (21) 保密协议 (22) 第五节售后服务 (24) 项目背景 —————————————————— 随着全国文化信息资源共享工程与中国数字图书馆工程的起动,信息化已成为国际潮流,信息资源建设成为当务之急。信息资源建设的重点是电子文献、各类数据库、网络资源、电子档案、电子图书等新型数字化信息资源的建设。在数字化信息资源建设中,很大的一个需求是将现有的纸介质印刷品数字化,使之成为能够用计算机阅读、理解、查询、检索的电子文件,最终将其应用于数据库存储,或通过CD-ROM、Internet网进行出版,或上传数字档案馆供用户使用。 以传统纸张为载体的保存方式,占据了大量的空间,需要特殊的环境,而且不方便查询,随着时间的推移,还面临着腐蚀、老化等问题。而将纸介质文件信息进行电子化处理,保存到光盘上,具有存储、管理、共享等功能,还可以减少文件库房占地,节省保管设备和人员方面开支,又方便统计和进行远程查询。 因此,将档案、期刊、文件等资料通过扫描仪,扫描成图像文件,再通过处理转换成电子文档,建立目录和索引,制作成电子文件,已是当务之急。 第一节数字化加工作业前期准备 一.数字化工作人员准备 1 .甲方人员 职务:现场交接管理人员 人数要求:一名

DAT 31-2005 纸质档案数字化技术规范

纸质档案数字化技术规范 DA/T 32-2005 (2005年4月30日发布2005年9月1日实施) 一、概述 国家标准《纸质档案数字化技术规范》DA/T 31—2005是由中国国家档案局颁布的,其批准时间为2005年4月30日,实施时间为2005年9月1日。 该标准共分为十三章。其中包括范围,规范性引用文件,术语和定义,纸质档案数字化基本要求,档案整理,档案扫描,图像处理,图像存储,目录建库,数据挂接,数据验收,数据备份,数字化成果管理等。 该技术规范的出台结束了我国纸质档案数字化的初探阶段,标志着我国各级档案馆馆藏数字化技术的成熟。 二、主要条款简介 第一章范围

本标准规定了纸质档案数字化的主要技术要求。本标准适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。 第二章规范性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件其最新版本适用于本标准。 GB/T 17235.1-1998 信息技术连续色调静态图像的数字压缩及编码第一部分:要求和指南。 GB/T 17235.2-1998 信息技术连续色调静态图像的数字压缩及编码第二部分:一致性测试GB/T 18894-2002 电子文件归档与管理规范。 第三章术语和定义 下列术语和定义适用于该标准。 (1)数字化digitization 用计算机技术将模拟信号转换为数字信号的处理过程。

(2)纸质档案数字化digitization of paper-based records 采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。(3)数字图像digital image 表示实物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样——连续函数,并在采样点上将值最小化后的阵列。 (4)黑白二值图像binary image 只有黑白两级灰度的数字图像。它对应于黑白两种状态的文字稿、线条图等。 (5)连续色调静图像continuous-tone still image 以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。在纸质档案数字化过程中,通常表现为灰度扫描利彩色扫描两种模式。 (6)分辨率resolution 单位长度内图像包含的点数或像素数,一般用每英寸点数(dpi)表示。

相关文档
相关文档 最新文档