English

OCR:让文档输入更精彩

2003-10-17 来源:生活时报 本报记者 孙元鹏 我有话说

当今社会的信息资源就像是放在两块相互分隔的大陆之上,一块是纸质媒体,另一块是电子媒体。从技术上看我们可以把电子媒体上的信息印刷到纸张上,也可以把纸质媒体上的信息数字化放在电子媒体之中,这两块大陆似乎已经可以连接起来了。特别是印刷出版业的电子化使这种沟通得到革命性的发展,告别了铅与火,走向了光与电。但这个过程并不对称,图文资料的数字化过程遇到的技术难度远远超过前者。但当OCR技术日渐走向成熟的今天,将信息从纸质媒体转向电子媒体,这种沟通变得不再困难。

中文OCR技术现状是中文OCR即采用扫描仪、数码相机等输入设备,把中文印刷体的文稿送入计算机并以计算机文档表示出来的高新技术,主要用于文字和表格输入,可以用扫描仪将整页的印刷文稿或者表格输入计算机,由计算机上的识别系统自动生成汉字文件,替代人工键入汉字和表格的工作。中文OCR有普及版和专业版之分,现在市场上扫描仪捆绑的OCR软件均为普及版。目前印刷体OCR的识别技术已经完全达到实用的程度,即使对印刷质量较差的文字的识别率也达到95%以上。由于手写体OCR技术的限制,专业型OCR系统的产品多是面向特定的行业,信息格式较为固定,识别的字符集相对小,经常与专用的输入设备结合使用。

随着我国计算机应用的普及深入,专业版OCR有批处理功能,性能更加优化,识别率也不同于普通版OCR。国家863计划对OCR技术的研究给予了很大的资助,加快了OCR技术的进步。如作为国家863计划重点支持项目的汉王OCR,在技术就已经非常成熟,并取得了较高的应用成就。它的特点主要是识别率大幅度提高,尤其是对中英文混排文稿,识别率为99%。可识别宋、仿宋、楷、隶、行等八种印刷字体,对手写体、数字、标点符号的识别也可点可圈;对表格识别也有了重大的突破,无论横版、竖版、中文表格、图文混排文件都能识别,版面还原、自动版面分析和识别功能也大大加强。应用才是硬道理,好用才是好产品。这些最简单的描述也许是高科技产品能够成为成功产品的主要的评判标准,对于OCR来说同样如此。目前市场上基于OCR技术的产品已经不少,在国内OCR技术领域占领先地位的汉王科技新近推出的“文本王”就是其中的典范,充分体现了OCR技术应用于文字、表格录入上的优越性。此外清华文通等公司也推出了类似的产品。

批量输入,高速准确。许多的机关企业都有大量的文字处理工作要完成,诸如人事档案的处理、各类文件的整理分发等。这些工作的技术难度虽然不大,但却要耗费大量的人力物力,而且文字图表的录入速度太慢,一直是影响企业文字工作效率的主要因素之一。针对这些情况,汉王科技依赖自主OCR技术开发出了高速计算机文档录入系统——汉王文本王,使以上问题迎刃而解。文本王可以不间断地批量识别输入1000页稿件;全自动识别宋体、楷体、黑体、魏碑、隶书、行楷等百余种中文简繁,英文、数字、表格、图片混排的稿件;同时识别速度快,每分钟高达6000字;其识别准确率也高达99.8%。而且文本王对输入文稿的印刷质量适应性强,支持灰度和彩色图像处理。文本王独有的海量处理功能将使文字录入工作变得十分的轻松。

一键扫入,WORD输出。高科技产品往往都戴着神秘的面纱,让普通人很难直接与其沟通。将OCR技术应用于文档录入再合适不过了,但也有人认为以前的产品没有建立起简洁有效的人机交流机制,在客观上要求操作人员要具有比较高的技术应用能力。但现在的不少产品在这方面都有了明显的改观。汉王文本王充分考虑使用者的要求,迎合当今科技产品的人性化特点。操作简单快捷,只需对扫描仪录入键轻轻一按,即可在WORD文档中直接完成录入工作,无须文件的保存、复制、粘贴,无须文件格式的转化。真正实现与WORD无缝连接和“傻瓜”操作,使高科技产品的操作更简单,方便用户使用。

图文表格,轻松输入。依靠鼠标键盘完成图表的计算机录入比纯粹文字的录入更加复杂,而日常工作中对表格的处理却是少不了的。各类报表信息的搜集整理、各类文件的传达都对处理设备提出了极高的要求。OCR录入技术的成熟完全解决了这一难题,无论是文本还是表格,他都能瞬间为你转化成为电子文档。

版面还原,超强校对。有过文字处理工作经验的人可能都知道,完成资料的扫描只是全部工作的一个很小的部分,更多的工作还是在后期的校对、整理和保存,这也正是文字处理工作比较繁琐的主要原因。后期的工作往往不受重视,可是后期工作完成的好坏将直接影响整体工作质量和效率,其意义重大。许多OCR技术产品都为广大的文字工作人员提供了极其简单但效果出众的校对功能,无形之中帮助工作人员节省了时间,提高了工作效率。其中文本王能够使录入后版面格式保持原样,校对时,录入稿与原文同时出现,既精确保留了原版面格式,准确恢复文本原貌,又与录入稿形成清晰对比,实现快速准确的超强校对。这将为用户节省大量的时间。在实际的工作中,可能并不是需要资料的全部内容,这时传统的录入方式的缺点就出现了,可能会浪费大量的时间和精力来录入、校对一些不需要的内容。文本王针对这一情况特别为广大的用户提供了版面的自动分析功能。当被录入的文稿中同时存在中文、英文、图片、表格时,无论批量输入方式、还是全自动、半自动输入方式,文本王都会对输入的内容进行版面的自动分析,划出图片框、表格框、文字框。用户可以有选择性地录入需要的内容。这样可以大大节约工作人员的时间和精力。

真人发声,文本朗读。此外传统的文本校对都是悄无声息的,这样的工作方式不容易使工作人员在长时间的工作中都保持高效率。汉王文本王等基于OCR技术开发的录入系统还加入了声音校对功能,可对录入后的文字进行朗读校对,全部真人发声,校对者只需看着原稿即可,这样极大地提高了工作效率。中英文相互转化,英文单词查询等许多实用的功能也大大方便了用户。如果你走进国家图书馆数字化作业大厅,就会看到许多OCR输入设备在高速运转,大批的图书资料运进来,很快又运走了。就在这一进一出的顷刻间,这些书报资料就已经成功地变成数字化资料了。这将大大方便人们管理、检索、阅读和引用图书资料。

随着各行业OCR技术的应用,相应的OCR产品形态日益丰富,从而启动了一个更为广阔的市场空间。以汉王OCR为例,不仅在扫描仪捆绑软件中占有了大部分市场份额,而且还推出了一系列OCR应用产品,例如名片通、文本王、OCR录入工厂、票据识别系统等,还有许多产品则广泛应用于银行、政府、工商税务、公安、图书出版、教育、交通等行业,真正做出了OCR的声势。而在国外OCR技术也在金融、保险、税务等领域广为应用,比如在日本的金融行业中,大量的存单、储单、保单以及户籍登记都是通过OCR技术来实现的;而在美国其大规模的人口普查、针对个人的信贷业务、个人所得税申报等,也都采用了OCR技术。我们有理由相信经过众多专家或专业人士的努力,OCR会很快地进入到信息化产业的各个领域,并会有更多的新产品奉献给用户,OCR技术产业化之路定会实现质的飞跃。

 

手机光明网

光明网版权所有

光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明网邮箱 | 网站地图

光明网版权所有