摘 要
通过对人力资源和社会保障业务纸质档案进行自动影像化处理,可以延长档案的保存时间,降低人力物力投入,缩短人力资源和社会保障档案查询业务的经办时间,最终提高人力资源和社会保障业务经办的整体效率。
【关键词】信息技术 档案影像 人力资源和社会保障
纸质档案材料是人力资源和社会保障业务经办的具体依据,其中所包含的信息价值远远大于其本身。因此人力资源和社会保障档案管理水平的高低,也潜在决定着一个地市人力资源和社会保障经办能力的高低。当前我国多数地区的信息系统只是通过信息化手段记载了参保主体的基本信息,缴费信息等业务信息,而针对参保主体在业务办理过程中所提供纸质业务档案材料的管理仍旧采用原始手工管理模式。面对海量的纸质业务档案材料,即使工作人员通过某些手段已经详细记载了其所放置的位置,但在查阅过程中仍然因为档案移动搬迁、档案拆卷、档案翻阅等步骤感到不便,其次由于纸质材料的特质性,随着档案材料的搬移、年份、存放环境等原因,给档案材料带来一定程度的磨损,为今后的保存及查阅带来困难。
在清晰认识档案重要性的前提下,我市经过探索与研究建成一套业务档案影像化系统。此系统不但实现了业务档案计算机影像化保存、查阅,而且在档案图像与业务关联的核心点上实现了计算机自动识别对应模式。这里通过此文,将我市档案影像系统建设思路进行描述,希望能够对我国人力资源和社会保障信息化建设有所帮助。
1 系统概述
档案影像系统通过扫描识别图像并自动将图像与业务信息相对应,实现业务信息与影像信息无缝关联及纸质档案材料电子影像化保存,最终以科学管理、快速查阅业务档案为目的。我市档案影像系统总体技术采用J2EE框架技术,B/S/S+控件模式。B/S/S以满足档案系统中心统一管理为目的,控件主要用于满足驱动本地扫描设备进行扫描,并进行OCR影像识别、本地上传所用。
在业务使用方面,系统特点为:
(1)与业务系统,业务信息紧密关联,支持业务系统实时查看业务影像电子档案;
(2)业务表单规范统一;
(3)支持实时扫描及事后批量扫描双归档处理模式;
(4)影像图片支持人工识别与业务信息对应及计算机自动识别与业务信息对应两种模式;
(5)支持影像材料按需上传存储;
2 业务流程及设计要点
一笔完整的业务需要经历业务单据接收、业务办理、业务主件表单产生、纸质材料归集整理、扫描、识别、上传、立卷、装订塑封等过程。各过程技术要点如下:
2.1 业务办理
业务办理同时业务系统会记载此笔业务办理情况,此时的关键是使档案影像系统也必须清晰的了解主业务系统办理了何种业务。因此针对业务信息的记录方式,主业务系统与档案系统之间必须达成一致,即两系统之间应该遵守相同的业务信息记载规则,建立双方共用共享的公共信息。
2.1.1 业务信息记载规则
需要将业务按照一定的规则进行分类编码,制定主业务系统与档案影像系统共同遵守的业务数据规则。规则如表1。
如表1所示三级业务为最终需要进行影像化处理的业务。设定业务编码规则为“一级业务分类号-二级业务分类号-三级业务分类号”,例如单位参保登记业务编码“SI-01-001”=社会保险(SI)-公共业务(01)-单位参保登记(001)。要求业务编码为业务的唯一标识,不允许重复出现。在业务编码的基础之上,针对办理的每笔业务都需要生成对应的业务序列号码,用于生成业务条纹码图像,打印在业务表单上部,最终供扫描设备扫描识别。为保证业务序列号码的唯一性,我市业务序列号码生成规则为“经办时间(yyyymmddhhmiss)-业务编码-业务主体编号”。例如单位编号为0528958的某单位,在2016年1月8日办理了单位参保登记业务,则对应的业务序列号码为“20160108161234-SI-01-001-0528958”。
2.1.2 数据信息共享
主业务系统与档案影像系统为两套独立的系统,若使两系统之间能够有机的配合使用,必须建立相应关联的信息,保证两系统在基础信息,业务信息共享统一。
基础信息主要指组织经办机构信息、用户信息、业务编码信息。
经办机构信息主要包括经办机构名称、经办机构编号;用户信息主要包括用户ID、用户名称、用户密码、用户所属经办机构编号;业务编码信息主要包括业务编码名称,业务编码。
业务信息统一指业务系统生成的业务信息数据结构符合档案系统的要求。
业务信息包括:主体编号、主体名称、业务编码、业务名称、业务序列号码、经办机构、经办人、经办时间。
业务影像信息:业务序列号码、图片文件名称、图片信息、上传时间。
2.1.3 业务表单格式统一
作为与业务关联的档案影像系统,其核心是档案材料的影像化图片与相应业务信息的自动关联。我市在解决档案影像与业务自动关联的问题中,采用在业务表单中固定位置打印以业务序列号为内容的CODE39条纹码图像,便于OCR条码识别,提高影像扫描准确性。
2.1.4 业务办理完毕数据格式
业务办理至此,业务信息表中数据如表2所示。
此时因业务纸质材料尚未进行扫描识别上传等操作,业务影像信息表中尚未生成数据。
2.2 纸质材料归集整理
档案系统的正常使用要求业务经办人员在归集整理档案材料时遵守如下规则,以利于后期进行批量扫描:
(1)业务主表单打印后,业务条纹码图像区域不允许进行任何形式的涂画,需要保持清洁。
(2)需要影像化材料不允许粘贴任何物体。
(3)叠放材料时,要求表单内容统一向上放置,业务主表单在前置,业务附表单置后顺序整齐叠放。
2.3 纸质材料影像化处理—扫描
不同的业务种类,业务办理数量,办理频率及办理步骤也不经相同,因此从业务办理实际情况出发,针对任何一种需要进行档案影像资料的采集处理,都需要支持单笔业务实时扫描上传及批量业务非实时扫描上传两种处理模式。
2.3.1 单笔业务实时扫描模式
在每个业务办理功能页面中新增“档案处理”功能按钮。业务办理完毕之后点击此按钮系统弹出档案处理窗口。在此窗口中将进行扫描,上传操作。扫描上传操作完毕后会将上传的图片对应至此笔业务信息下,实现档案图片与业务信息的关联。此种模式是将指定图片信息对应至指定业务信息中,所以此模式不需要进行图片信息识别的操作。实时扫描完成之后业务影像信息表中生成相关数据如表3所示。
2.3.2 非实时批量扫描上传模式
业务人员办结完每笔业务后,打印带有业务条纹码图像的业务主表单,并将需要存档的业务材料按照纸质材料归集整理,形成业务待扫描材料即可。待当日工作完成之后,将所有业务待扫描材料集中叠落整理好之后,放入批量扫描设备中,经过扫描,图形识别,上传三个步骤即可完成档案材料从纸质形式向影像化的转换,同时系统经过对业务主表单业务条纹码图像识别与计算,自动将一叠材料中各笔业务对应材料进行划分、归类,最终实现自动与相应业务信息的对应。至此业务资料影像化处理完成,继续运用系统立卷功能进行档案资料电子化立卷即可。
(1)扫描参数设置。针对批量扫描,在实施扫描之前需要进行扫描参数的设置。我市使用的扫描设备为富士通设备,系统开发时已将此设备的驱动程序嵌入在系统控件中,故此可以直接在档案系统使用时设置扫描设备的参数。具体扫描参数分别为:
扫描驱动类型参数:此参数选择具体适用扫描仪设备的驱动。
输出分辨率:在保证图像尺寸最小,又保证不影响识别率的条件下,统一设置为300dpi。A4的业务表单大小普遍在300KB左右。
存放临时文件目录:在本地计算机中设置的目录,用于暂时存放扫描识别后的图片,待后期图片上传后将会删除本地已上传的图片。识别后,在此目录下以“业务条纹码编号”为名称生成文件夹,将识别对应的图片放在相对应的文件夹下。
扫描类别:扫描模式,按照业务需求可支持单面扫描或双面扫描。
是否自动上传:此参数若选择为“是”,在扫描识别完成之后,系统将会自动进行图片的上传;选择为“否”后,不会自动上传图片,何时上传时间图片将取决于“上传时间范围”参数。
上传时间范围:在是否自动上传选择为“否”的前提下,此参数有效。建议将此时间设置为下班以后的一段时间范围,以免由于大量图片信息上传而占用网络带宽。
(2)识别。此步骤针对扫描过程形成的图片进行识别、分类。自动识别过程为识别图片固定位置是否带有业务条纹码图像信息,若有则对业务条纹码图像进行分析,提取出业务条纹码图像所包含的业务序列号码信息并根据业务序列号码信息新建立档案分类节点,并将此图片依附于此节点下;若没有业务条纹码图像信息,则将此图片依附于最近生成的分类节点下,依次循环识别所有图片以完成最终的过程。流程图如图1所示。
例如有5页纸质材料,识别完成后将会按照图2结构进行分类。
通过上述自动识别过程,可知自动识别的核心是图片与以业务序列号码信息为名称的节点之间自动对应过程。识别完成之后,完成将图像文件与业务序列号码对应,但此时具体影像图片并没有上传,所以影像信息表中数据如表4所示。
(3)上传。上传的机制分为3种:
①在将是否自动上传参数选择为“是”时,扫描识别完成后,系统会自动将所有扫描识别的影像图片强制上传至数据库中;
②在将是否自动上传参数选择为“否”的条件下,在上传时间范围参数规定的范围内,系统运行状态下,会将所有需要上传的图片上传至数据库中;
③在将是否自动上传参数选择为“否”的条件下,在上传时间范围参数规定的范围外,支持人工手动触发上传。手动上传支持选择性上传,及只将选择上的图片进行上传(支持全选、全不选、反选等操作)。
上传完整及延续性上,上传过程中,系统以单个图片作为传输单元,系统确定此影像图片已上传成功后,方删除本地计算机磁盘中的对应影像图片;若在上传过程中因断电,死机等导致上传中断而失败,则再次进入系统后,支持对剩余未上传图片进行续传。
上传完毕后,影像信息表中数据如表5所示。
(4)立卷。针对已经完成扫描识别上传的业务纸质单据最后需要进行立卷。在业务档案系统中,系统会对未立卷的文件按业务分类及工作人员设定的顺序进行排列,然后系统会根据每笔业务对应的图片数量计算出页数,按照业务图片数量之和<=200页的原则,得出200页共涉及多少笔业务,最终将这些业务记录进行立卷。立卷完成之后打印卷内目录,贴附于卷上以供查阅。
(5)档案查阅。档案影像化最终的目的是方便管理查阅。因为业务系统与档案系统在整体设计中采用信息共享模式,所以所有的档案存储信息都可以通过业务系统方便进行查阅。查询条件有主体编号、主体名称、业务名称、经办时间范围等。
3 工作效率
在操作时间上,以一名工作人员、一台扫描仪、一台计算机为单元,对分属于10笔业务的100张纸质单据,分别以手工识别对应处理模式与计算机自动识别模式进行处理,针对两种处理模式操作时间对比如表6所示。
4 总结
此系统通过我市一段时间的运行,切实感受到其为档案工作的管理、查阅带来了极大的方便。在人力资源和社会保障业务信息化的大环境下,档案管理工作也必将走上信息化普及之路。本文以我市目前实施经验为依据整理而成,难免有考虑不周之处,但希望此文能为我国人力资源和社会保障信息化建设提供一定的参考价值。
参考文献
[1]崔梦天,张世禄,赵海军.“基于分布式电子影像档案管理系统的模式开发探讨”[J].情报杂志,2005(01).
[2]方晓俭.“浅谈数字化档案技术及应用”[J].计算机时代,2002(06).
[3]李莉,吴永明.“银行支付交易中电子影像系统的研究与实现”[J].计算机应用与软件,2007(01).
作者简介
于军,乌鲁木齐市人力资源和社会保障信息中心工程师,长期从事人力资源和社会保障领域信息化建设工作。
作者单位
乌鲁木齐市人力资源和社会保障信息中心 新疆维吾尔自治区乌鲁木齐市 830000