档案数字化工作流程是怎样的?

如题所述

档案数字化加工流程
前期档案整理
  档案借出
  从档案室接件,填写档案移交清册,一式两份。拿到档案后,开始核对档案数量,数量核对无误后签字确认,将档案拿回加工现场。
  目录数据准备
  按照各类档案整理规定的要求,在档案管理系统著录目录数据。如有错误或不规范的案卷题名、文件名、责任者、日期、起止页号等,应进行修改。
  拆除装订
  在不去除装订物情况下,会影响扫描工作进行的档案,应拆除装订物。拆除装订物时应注意保护档案不受损害。
  页面修整
  破损严重、无法直接进行扫描的档案,应先进行技术修复,褶皱不平影响扫描质量的原件应先进行相应处理(压平或熨平等)后再进行扫描。
  档案扫描
  扫描方式
  (1)根据档案幅面的大小(A4、A3、A0等)选择相应规格的扫描仪或专业扫描仪(如工程图纸可采用0号图纸扫描仪)进行扫描。大幅面档案可采用大幅面数码平台,或者缩微拍摄后的胶片数字化转换设备等进行扫描。
  (2)纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案,可采用高速扫描方式以提高工作效率。
  扫描色彩模式
  (1)扫描色彩模式一般有黑白二值、灰度、彩色等。通常采用彩色。
  (2)页面为黑白两色,并且字迹清晰、不带插图的档案,可采用黑白二值模式进行扫描。
  (3)页面为黑白两色,但字迹清晰度差或带有插图的档案,以及页面为多色文字的档案,可采用灰度模式扫描。
  (4)页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,可采用彩色模式进行扫描。
  扫描分辨率
  (1)扫描分辨率参数大小的选择,原则上以扫描后的图像清晰、完整、不影响图像的利用效果为准。
  (2)采用黑白二值、灰度、彩色几种模式对档案进行扫描时,其分辨率一般应设为200-300dpi。特殊情况下,如文字偏小、密集、清晰度较差等,可适当提高分辨率。
  图像处理
  图像数据质量检查
  (1)对图像偏斜度、清晰度、失真度等进行检查。发现不符合图像质量要求时,应重新进行图像的处理。
  (2)由于操作不当,造成扫描的图像文件不完整或无法清晰识别时,应重新扫描。
  (3)发现文件漏扫时,应及时补扫并正确插入图像。
  (4)发现扫描图像的排列顺序与档案原件不一致时,应及时进行调整。
  纠偏、去污、图像拼接、裁边处理
  (1)对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。对方向不正确的图像应进行旋转还原,以符合阅读习惯。
  (2)对图像页面中出现的影响图像质量的杂质,如黑点、黑线、黑框、黑边等应进行去污处理。处理过程中应遵循在不影响可懂度的前提下展现档案原貌的原则。
  (3)对大幅面档案进行分区扫描形成的多幅图像,应进行拼接处理,合并为一个完整的图像,以保证档案数字化图像的整体性。
  (4)采用彩色模式扫描的图像应进行裁边处理,去除多余的白边,以有效缩小图像文件的容量,节省存储空间。
  图像存储
  存储格式
  (1)采用黑白二值模式扫描的图像文件,一般采用PDF格式存储。
  (2)采用灰度模式和彩色模式扫描的文件,一般采用PDF格式存储。
  图像文件命名
  (1)纸质档案目录数据库中的每一份文件,都有一个与之相对应的档号,以该档号为这份文件扫描后的图像文件命名。如图像文件较大,不便于网络浏览,可拆分为多个图像文件,文件名后增加A、B、C等区别。
  (2)分别建立文件夹,以文件档号命名,并存储对应图像文件。
  数据挂接
  将每一份纸质档案扫描所得的图像存储到相应档号的文件夹后,认真核查每一份图像文件的名称与档案目录数据库中该份文件的档号是否相同,图像文件的页数与档案目录数据库中文件的总页数是否相同等。通过每一份图像文件所在文件夹的名称与档案目录数据库中该份文件的档号的一致性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。
温馨提示:答案为网友推荐,仅供参考
第1个回答  2019-11-08
  一、术语和定义
  1、数字化
  用计算机技术将模拟信号转换为数字信号的处理过程。
  2、纸质档案数字化
  采用扫描仪或数码相机等数码设备对纸质档案进行数字加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。
  3、数字图像
  表示实物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样——连续函数,并在采样点上将值最小化后的阵列。
  4、黑白二值图像
  只有黑白两级灰度的数字图像。它对应于黑白两种状态的文字稿、线条图等。
  5、连续色调静态图像
  以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。在纸质档案数字化过程中,通常表现为灰度扫描和彩色扫描两种模式。
  6、分辨率
  单位长度内图像包含的点数或像 素数,一般用每英时点数(dpi)表示。
  7、失真度
  对档案进行数字化转换后,数字图像与档案原件在色彩、几何等方面的偏离程度。
  8、可懂度
  数字图像向人或机器提供信息的能力。
  9、图像压缩
  清除图像冗余或图像近似的任一种过程,其目的是对图像以更紧凑的形式表示。
  二、纸质档案数字化基本要求
  1、基本原则
  纸质档案数字化的基本原则是使档案信息资源准确方便快捷地提供利用,使可以公开的档案信息资源得到共享,以满足社会对档案利用的需求。
  2、数字化对像的确定原则
  应当对所要进行数字化的对象按照一定的原则和方法进行确认,只有符合一定要求的纸质档案文献才能进行数字化。
  1)符合国家法律法规的原则
  纸质档案的数字化,必须符合国家档案开放规定以及有关规定。
  2)价值性原则
  属于归档范围且应永久或长期保存的、社会利用价值高的档案可列入数字化加工的范围。
  3、基本环节
  纸质档案数字化的基本环节主要包括:档案整理、目录建库、档案扫描、图像处理、图像存储、数据质检、数据挂接、数据验收、数据备份、成果管理等。
  档案扫描
  1、扫描方式
  1)根据档案幅面的大小(A4、A3、A0等)选择相应规格的扫描仪或专业扫描仪(如工程图纸可采用0号图纸扫描仪)进行扫描。大幅面档案可采用大幅面数码平台,或者缩微拍摄后的胶片数字化转换设备等进行扫描,也可以采用小幅面扫描后的图像拼接方式处理。
  2)纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式以提高工作效率。
  2、扫描色彩模式
  1)扫描色彩模式一般有黑白二值、灰度、彩色等。通常采用黑白二值。
  2)页面为黑白两色,并且字迹清晰、不带插图的档案,可采用黑白二值模式进行扫描。
  3)页面为黑白两色,但字迹清晰度差或带有插图的档案,以及页面为多色文字的档案,可采用灰度模式扫描。
  4)页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,可视需要采用彩色模式进行扫描。
  3 、扫描分辨率
  1)扫描分辨率参数大小的选择,原则上以扫描后的图像清晰、完整、不影响图像的利用效果为准。
  2)采用黑白二值、灰度、彩色几种模式对档案进行扫描时,其分辨率一般均建议选择≥300dpi。特殊情况下,如文字偏小、密集、清晰度较差等,可适当提高分辨率。
  3)需要进行OCR汉字识别的档案,扫描分辨率建议选择≥300dpi。
  图像处理
  1 、图像数据质量检查
  1)对图像偏斜度、清晰度、失真度进行检查。发现不符合图像质量要求时,应重新进行图像的处理。
  2)由于操作不当,造成扫描的图像文件不完整或无法清晰识别时,应重新扫描。
  3)发现文件漏扫时,应及时补扫并正确插入图像。
  4)发现扫描图像的排列顺序与档案原件不一致时,应及时进行调整。
  5)认真填写相关表单,记录质检结果和处理意见。
  2、纠偏
  对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。对方向不正确的图像应进行旋转还原,以符合阅读习惯。
  3、去污
  对图像页面中出现的影响图像质量的杂质如黑点、黑线、黑框、黑边等应进行去污处理。
  档案数字化工作流程
  数据关联
  以纸质档案目录数据库为依据,
  将每一份纸质档案文件扫描所得的一个或多个图像存储为一
  份图像文件。
  将图像文件存储到相应文件夹时,
  要认真核查每一份图象文件的名称与档案目
  录数据库中该份文件的档号是否相同,
  图像文件的页数与档案目录数据库中该份文件的页数
  是否一致,
  图像文件的总数与目录数据库中文件的总数是否相同等。
  档案数字化工作流程
第2个回答  2020-02-11
通过各类软硬件技术将传统纸质档案转化为电子化档案数据,辅以人工校对,最终将合格的档案数据存储到档案管理系统平台,方便档案管理人员快速调取阅览。基本操作流程为:档案前整理、档案扫描、图像处理、图像质检、文字校录(条目著录)、图像OCR(合成PDF并文字识别)、数据存储备份。需要各类数字化流程加工软件的
第3个回答  2022-12-17
档案的收集、整理、保管、鉴定、统计和提供利用的活动。档案内容包括:档案收集、档案整理、档案录入、档案数字化、档案系统、档案软件定制、档案价值鉴定、档案保管、档案编目和档案检索、档案统计、档案编辑和研究(见档案文献编纂)、档案提供利用、档案销毁。

这些工作的划分只是相对稳定而不是绝对的,也有分为 8个环节的,也有分为基础工作和利用工作两大部分的。由于现代档案管理工作已成为复杂的系统,故也有按多层次进行划分的方法。其第一层次分档案实体管理和档案信息开发两个子系统,各子系统又下分若干层次小系统。
档案实体管理分收集、整理、鉴定、保管、统计等工作环节;档案信息开发又分信息加工和信息输出两部分,信息加工由编制目录、编辑文献汇编和编写参考资料构成,信息输出由提供阅览、复制、咨询、函调、外借以及出版、展览等多项服务活动构成。
第4个回答  2019-12-10
纸质档案的数字化流程一般分为档案出库——档案整理——扫描——图片处理——图片格式转换——质量检查——数据挂接——总检——档案入库还卷
相似回答