|
|
|
产品概述
"华通OCR"是华通辨识系统在Windows环境下的最新版本。它保留了原有版本繁、 简体多体中文辨识、中外文混排同时辨识、横竖版面混排及复杂版面分析、理解与文字辨识、表格自动辨识、批次辨识及将辨识结果自动送入其他应用程式和剪贴簿等功能外,新增加了韩文辨识、语音校对等功能,辨识字形档达到2万余字,手写体辨识率大幅度提高, 并且支援彩色影像处理。因而应用面更广,实用性更强,是"华通OCR"文字辨识领域的新的里程碑。
|
系统特色
精准的OCR识别
颠覆将经过扫描获得的、不能编辑修改、占用较大磁碟空间的电子"图像文件"进行识别,转化易于编辑修改、占用较小磁碟空间的电子文档。这是本系统的核心。
|
高效校对
利用横向校对及纵向校对手段对识别后所得的电子文档进行校对改错,使档案的文字正确率达98%。这是保证系统工作质量的重要环节。
利用内建的常用词库自动校对辨识出的文字,并标示出辨识时所碰到的疑问字,大幅节省使用者校对的时间。 |
版面还原
将经校对改错的电子文档以用户所需的格式(HTML、RTF、TXT等)导出在相应的应用软体中,可实现图文结合(TXT格式除外),进行原式原样的编辑,并可调整、丰富版面资讯,使生成最佳的版面。还可以从文档建立逻辑结构,便于输入资料库。 |
相似字编辑修改
汉字辨别的过程,是系统按照一定的演算法和准则,确定出一系列与扫描得到的影像比较相似的汉字,其中最相似的一个也就是辨别结果。而这里所说的相似字,则是指由系统列出所有这些可能的汉字,从而供用户选择正确的结果。在华通OCR 系统的辨别输入过程中,无论辨别出错的汉字属于一个辞汇,还是一个与前后汉字都无法组成辞汇的单字,采用相似字的编辑方法,都是比较方便而有效的。因此, 华通OCR 系统在进入编辑环境后,总是自动处于相似字状态,便于用户进行编辑修改。
|
自动版面分析
影像输入后系统后,系统可自动进行版面分析(蓝框:横向文字,红框:直向文字),大大结省使用者框选版面时间。
|
常用符号编辑修改
常用符号,主要指那些键盘上不易输入而又常常用到的标点或其他符号。如果辨别出错的是符号,就可方便地通过【常用符号】的方式进行编辑修改。当切换到【常用符号】状态后,萤幕左下角的编辑修改状态栏域内,检视出"常用符号"四个字,并在其后面的编辑修改候选字区域内,列出常用的符号。萤幕上每次列出的常用符号都是十个,可以按键盘上的【Shift + > 】键或【Shift + < 】键进行滚动检视,也可以用滑鼠按萤幕上符号前面的或进行滚动检视。如果萤幕上检视出所需要的符号,按符号前面相应的数位键或直接用滑鼠按所需的符号即可。
|
识别多国语言
印刷体的文字,包括简(繁)体多体汉字、纯英文、日文、韩文、汉英混排文本。
|
识别多种影像模式
对黑白二值、256级灰度及24位元元彩色图像的各种复杂版面的中文报纸均可进行版面分析、版面理解,并有准确的复原能力。
|
支援多种格式输出
TXT、HTML、RTF等标准格式,并可制作成能供电脑阅读和查询检索的电子文档。
|
系统需求
|
一般配备 |
建议配备 |
作业系统 |
Windows XP、Vista、7 | Windows XP、Vista、7
|
处理器 |
Intel E3300 或更高机型
| Intel Core i3 或更高机型
|
记忆体 |
1GB | 2GB |
硬碟空间 |
250MB (系统安装空间)
| 250MB (系统安装空间)
|
其他设备 |
光碟机/ USB 2.0 连接埠
| 光碟机/ USB 2.0 连接埠
|
|
|
|
|