尚书7号ocr文字识别系统是应用OCR技术,为满足书籍、报刊杂志、报盘票据、公文档案等录入需求,实现系统管理方式而设计的软件系统,本软件系统正是适用于个人、小型图书馆、小型档案馆、小型企业进行大规模文档输入,图书翻印、大量资料电子化的软件系统。
功能介绍
1、识别字符简体字符集:国标GB2312-80的全部一、二级汉字6800多个。
2、纯英文字符集。
3、简繁字集:除了简体汉字外,还可以混识台湾繁体字5400多个以及香港繁体字和GBK汉字。
4、识别字体种类能识别宋体、仿宋、楷、黑、魏碑、隶书、圆体、行楷等一百多种字体,并支持多种字体混排。
5、识别字号初号 小六号字体。
6、表格识别可以自动判断、拆分、识别和还原各种通用型印刷体表格。
7、可支持繁体WINDOWS系统。
使用方法
1、软件安装完毕后,用户请点击桌面左下角“开始”,找到“尚书7号OCR”软件图标,并点击,打开尚书7号OCR的使用界面。
2、打开尚书7号OCR的“文件”采单下的“选择扫描仪”,选择对应扫描仪的驱动“MICROTEK SCANWIZARD 5”的选项,并选择“确定”。
3、选择“文件”菜单下的“扫描”,将打开扫描仪的驱动,如下图,下面的界面是扫描仪的“高级控制面板”。
4、请注意选择SCANWIZARD 5软件中,左面“设置”窗口中的“图像类型”,请选择“RGB色彩”或者“灰阶”的类型,并注意扫描仪分辨率是300PPI。
5、当用户作完“预览”后,设置需要扫描的范围,就可以点击“扫描”按钮,扫描仪将开始扫描的工作。将扫描好的文件,直接传递到尚书7号OCR默认的目录中(默认的存储图像文件的目录是用户计算机C盘下的SHOCR2002目录下的IMAGE目录)。扫描完毕后,请用户关闭掉扫描仪驱动程序SCANWIZARD 5.用户可以看到需要扫描的文件已经传递给尚书7号中,默认的文件名是HW001.JPG。
6、请用户选择尚书7号软件中的“编辑”菜单下的“自动倾斜校正”,让尚书7号软件对扫描进来的图像作相应的旋转,以保证图像中的文字是水平排列,而非倾斜。因为太过倾斜的文字,将影响到尚书软件的识别效果。
识别效果不佳的主要原因
1、 扫描设置不当,扫描图像时的扫描分辨率(Resolution)一般应设为300dpi,如果文档字体较小则需要将扫描分辨率设定为更高值如400dpi或600dpi。缩放比例(Scaling)设为100%,亮度阀值(Threshold,Brightness)需根据纸张和印刷的质量调节,避免扫描图像过黑或过淡 。
2、 如自动版面分析有错误,这时请用户用鼠标自己划分出正确的版面块;版面块的版式设置错误,如将横版的设置为竖版,竖版的设置为横版等,这时请用户自行将块的版式修改正确。
3、 原稿印刷质量太差,笔画断裂严重、油墨太浓、字与字之间粘连严重等也可能使识别率显著降低。
4、 识别语言选项选择不当,应根据原稿正确选择“简体”、“简繁”或“英文”。
Sayatoo字幕精灵电脑版是一款高效的字幕制作软件,用户可以自定义设置字幕的字体、布局、走字特效、颜色等多种参数。Sayatoo字幕精灵电脑版功能丰富,帮助用户制作出非常专业的高质量的卡拉OK音...
客服宝是一款简单、免费的跨平台快捷回复软件,提供了一键回复、跨平台支持、多人共享话术等不同功能,能够帮助用户有效解决工作中频繁遇到相同问题时重复回复的困扰。客服宝电脑版支持用户预设...
浩辰CAD看图王电脑版是高效实用的CAD看图工具,支持快速看图、3D浏览、CAD批注、CAD测量等多项功能。在浩辰CAD看图王电脑版中,您可以查看各种建筑及机械三维格式模型,还可以随意旋转、缩放、...
TeamViewer是一款高效的电脑远程控制软件,可以在各种网络条件下实现快速可靠的远程连接。它具备控制、桌面共享、文件传输及会议等基础功能,还支持远程打印、远程音频等高级特性,充分满足用户...
网易云音乐官方电脑版汇集海量的音乐资源,涵盖民谣、古典、流行、摇滚等多种类型。网易云音乐官方电脑版中用户能够享受到高品质的音乐播放和流畅的音频体验。软件内用户只要登录账号即可同步相...
Calibre官方最新版是一款功能强大的电子阅读器软件,Calibre能够在多种不同的电子设备上使用,并且Calibre可以将下载的书籍转换为电子书格式同步到软件之中,而且Calibre使用起来非常的简单,可...
发表评论
共0条
评论就这些咯,让大家也知道你的独特见解
立即评论以上留言仅代表用户个人观点,不代表系统之家立场