热门排行
简介
Umi-OCR是一款免费,开源,可批量的离线OCR软件,适用于 Windows10,11 平台。
可以批量识别普通图片并识别文字内容导出,以及还有支持忽略指定区域的特殊功能,例如可以屏蔽掉视频右上角水印和游戏的 UI 内容。
Umi-OCR 软件本体含 简体中文&英文 识别库。
配套 多国语言识别扩展包 可导入 繁中,日,韩,俄,德,法 识别库,请按需下载。
软件特点
免费:本项目所有代码开源,完全免费。
方便:解压即用,离线运行,无需网络。
批量:可批量导入处理图片,结果保存到本地 txt / md / jsonl 多种格式文件。也可以即时截屏识别。
高效:采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够,通常比在线OCR服务更快。
精准:默认使用PPOCR-v3模型库。除了能准确辨认常规文字,对手写、方向不正、杂乱背景等情景也有不错的识别率。可设置忽略区域排除水印、设置文块后处理合并排版段落,得到规整的文本。
更新日志
新功能:命令行模式。随时通过命令行调用Umi-OCR!
新功能:识图完成的通知悬浮窗。
新功能:清理引擎内存。
修复了一些问题,优化了一些UI表现。
使用教程
软件不大,解压之后,运行主程序,界面也比较简单,只有简单的几个按钮。
点击「浏览」按钮导入或者直接拖入需要识别的图片,图片格式支持 jpg、jpg、bmp 等常见格式,图片支持批量导入。
然后点击「开始任务」,软件将会识别所有已导入图片的文字信息,等待进度条走完,识别结果会显示在「识别内容」选项卡中。
与此同时,Umi-OCR 还会自动在桌面上生成一份带有识别结果的 txt 文本文档。
点击「复制文字」按钮可以全部复制下识别到的内容,如果只需要复制部分文字,可以用鼠标选择之后通过快捷键「CTRL+C」进行复制。
其实,许多时候,我们通过 OCR 识别图片上的文字,往往并不需要全部识别所有区域,比如某个截图上的水印文字就会很大程度上干扰识别结果。
Umi-OCR 支持自定义设置忽略图片中的某处区域,以便实现更精准的识别。
操作方式是先进入设置,然后「添加区域」,将需要忽略或者识别的区域进行重点框选,点击「完成」之后,设置就会生效。
设置一次,对所有图片全部起作用,如果不再需要先前设置的忽略区域,直接清空即可!
除了识别图片文件,对于已经复制到剪贴板的图片,Umi-OCR 也能识别。
「识别内容」选项卡下的「剪贴板读取」也即是对应的剪贴板识别功能。
软件默认仅支持识别简体中文和英文项目,如果需要识别其它语言,还需要单独导入多国语言识别扩展包才能使用。
多国语言识别扩展包包括的语言有繁体中文、日文、韩文、法文和德文,导入方式是将扩展包文件拷贝到软件目录。