亚博安全有保障

档案知识
















 档案知识

档案数字化过程中OCR技术的应用


摘 要:简单介绍档案数字化过程中的OCR技术,分析该技术的优势和在档案数字化工作中的独特应用,如,创新著录标引方式;实现真正的全文检索;支持双层PDF技术;拓宽档案用户利用面等。在此基础上,从OCR软件选择、参数设置、图像处理、人工校对等方面探讨提高OCR识别率的各种方法,以期使从事档案数字化工作的人员有所借鉴,提高档案数字化工作的效率。


关键词:档案;数字化; OCR


    信息时代,档案数字化已成为档案工作的重中之重,纸质档案扫描工作在各地如火如荼地进行。然而,扫描所产生的电子档案实际上只是以图像形式存在的文件,而非真正意义上的文本文件,也就是说,计算机只认识档案的外表,却不认识其内在文字,用户通过计算机看到档案的原貌,却不能对其中的内容进行引用、检索等操作,这无疑,对将来的电子档案利用工作造成了很大不便。考虑到档案用户的利用需求,若要得到文本形态的电子档案,使档案数字化工作更加有效、更加彻底,就要应用OCR技术。
。。。。。。



版权所有© 中国船舶重工集团公司技术档案馆公司 陕ICP备10003606号
亚博安全有保障(江苏)有限公司