Umi-OCR是一款批量图片转文字软件,就是通过OCR文字识别技术将图片里的文字给提取出来,用户只需要导入图片文件即可,使用非常简单。软件是基于PaddleOCR的离线OCR模块制作而成的,可以训练模型,支持修改PaddleOCR参数,添加不同的语言模型,软件可识别多国语言,当然想要使用后面所说的这些功能的前提是要会开发。
软件介绍
这款「Umi-OCR」和其它的 OCR 软件不一样的是它主要采用批量识别普通图片并识别文字内容导出,以及还有支持忽略指定区域的特殊功能,例如可以屏蔽掉视频右上角水印和游戏的 UI 内容。
批量识别图片导出文本对于一些场景用途来说比你一张一张去识别效率要高不少,使用也很简单,批量拖入你需要识别的图片。
接下来点击设置,可以设置勾选识别内容写入到本地文件,可以选择 txt 文本或者 Markdown 格式,选择输出目录。
如果你识别的图片里面有一些内容你不需要的,例如水印,可以点击添加区域功能,然后选择你不需要识别的区域。
忽略区域功能说明:
忽略区域1 :正常情况下,处于忽略区域1内的文字 不会 输出。
识别区域 :当识别区域内存在文本时,忽略区域1失效 ;即处于忽略区域1内的文字也 会 被输出。
忽略区域2 :当 忽略区域1失效时,忽略区域2才生效;即处于区域1内的文字 会 输出、区域2内的文字不会输出。
接着点击开始任务即可进行批量图片识别文字,从列表中可以看到内容基本上都被识别出来了。
导出的文本对比图片里面的内容,中文内容基本上没错误,不过个别英文内容可能是图片比较模糊的原因,识别出来有个别错误,所以识别的图片尽量选择清晰点的大图。
杂类工具
杂类工具
杂类工具
杂类工具
杂类工具
杂类工具
多多直播电脑版为主播提供了便捷的拼多多直播带货工具,商家可借此推广商品,提升店铺流量,而达人则能协助商家带货,获取佣金。多多直播电脑版有助于增强客户粘性,提高流量转化效率,支持商品...
央视影音是一款集新闻、综艺、体育、少儿等多类型节目于一体的视频播放软件,它不仅提供丰富的国内央视节目,还涵盖众多地方卫视和特色频道的精彩内容,用户喜欢看什么,一键搜索即可。央视影音...
浩辰CAD 2025是一款功能多样的CAD设计软件,终端数据和模型上云互通,打造全新的云端协同办公体验。该软件在参数化约束技术上取得了显著突破,为企业国产化应用提供了坚实有力的支持。同时,它...
Visual Studio Code是一款操作便捷的代码编辑器,具备强大扩展性,用户可通过丰富的插件库,轻松打造个性化的工作环境。它能够兼容多种编程语言,内置智能代码补全、语法高亮、代码折叠等多项功...
Audacity是一款功能多样的跨平台音频编辑软件,拥有剪切、复制、粘贴、淡入淡出等实用音频编辑工具,还支持降噪、均衡器、压缩等高级音频效果处理功能,全面满足用户的使用需求。同时,Audacity...
Drive SnapShot是一款性能出色的系统备份与恢复工具,集成远程备份、差异备份、还原硬盘等多项功能,并支持定时自动备份。Drive SnapShot无需安装,即开即用,提供中文界面,操作简单便捷,能够...
发表评论
共0条
评论就这些咯,让大家也知道你的独特见解
立即评论以上留言仅代表用户个人观点,不代表系统之家立场