文本文字

关注公众号 jb51net

关闭
天若幽心ocr文字识别工具 V4.49 绿色免费版

天若幽心ocr文字识别工具 V4.49 绿色免费版

热门排行

截图

滑动图片可查看更多>>

简介

天若幽心ocr文字识别工具是一款精准高效的OCR文字识别辅助软件,最近跟风制作了个OCR识别的小工具,调用了各大网站的ocr接口,免费不限次数(有道免费接口有ip限制仅供娱乐)。书本上的文字不想用手打输入,可以试试天若幽心ocr文字识别工具,它能自由转换图文,还能将图片转换成文字。

功能说明

  1、对于搜狗的接口识别效果很好,但是对于图片的尺寸有规定。

  本人对截取图片进行了尺寸上的优化,保证较小的文字也能识别。具体大家自行测试。

  2、腾讯ocr接口,也比较准确,但是速度比较慢。

  3、百度ocr接口,精确度还可以,但是标点符号识别不准确,速度一般。

  4、有道ocr接口,速度很快平均0.3-0.4秒就可识别出来。但是接口受ip请求的限制。(仅供参考)

特点说明

  图片识别

  JPG、BMP、PNG、TIF等格式图片识别为TXT;高效的识别各类复杂字体.识别率高达90%!

  PDF识别

  支持普通pdf文件,PDF扫描件、加密的PDF文件进行扫描识别.识别率高达90%。

  取色器

  现在网上各式各样的取色器应该不少了,包括之前一直用的蓝色经典推荐的ColorSPY , Firefox 下还有一个专门的取色器扩展ColorZilla ,这些都是很好的软件。但自从使用了 之后,这些我都很少用到了。原因很简单,各种取色软件的功能都大同小异, 非常小巧,既然有这样一个小软件能够包含取色器、屏幕放大镜和截屏的功能,为什么还要为这些功能而分开多个软件呢。的取色支持RGB 、Dec 和Hex 三种格式的色值,而且还有一个混色器,取到颜色之后可以再编辑。

  屏幕放大镜

  这确实是一个不错的功能,特别是现在我们已经习惯用DIV 来对页面定位,DIV 之间的对齐不像 表 格那样容易控制,有时为了调整几个象素的偏差,不得不对着屏幕盯很久。有这样一个放大镜就方便多了。使用时只需点击一下 窗口上的放大镜图标,鼠标变成一个放大镜的样子,然后在需要放大的地方按下左键就可以了,就像手里真的拿着一个放大镜一样。可以设置放大倍 律,放大镜的尺寸,外观(圆形,矩形以及圆角矩形)以及是否平滑显示,按ESC 键或单击右键可退出放大镜。

  屏幕录像机

  屏幕录像机功能可以录制屏幕动作,将窗口/对象、矩形区域或全屏区域的屏幕录制为高清晰 WMV 视频。

  截屏

  包括了全屏截取,当前活动窗口截取,截取选定区域,多边形截取和截取滚动页面等,基本上常用的都有了。特别是滚动截取,许多朋友为了这个功能不惜安装各种重量级的截屏软件

  识别过程

  1.图像输入、图像前处理、预识别:

  2.图像输入:对于不同的图像格式,有着不同的存储格式,不同的压缩方式,目前有OpenCV、CxImage等开源项目。

  3.预处理:主要包括二值化,噪声去除,倾斜较正等。

  4.二值化:

  - 对摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地识别文字,我们需要先对彩色图进行处理,使图片只前景信息与背景信息,可以简单的定义前景信息为黑色,背景信息为白色,这就是二值化图。

  5.噪声去除:

  - 对于不同的文档,我们对噪声的定义可以不同,根据噪声的特征进行去燥,就叫做噪声去除。

  6.倾斜校正:

  - 由于一般用户,在拍照文档时,都比较随意,因此拍照出来的图片不可避免的产生倾斜,这就需要文字识别软件进行较正。

  7.版面分析:

  - 将文档图片分段落,分行的过程就叫做版面分析,由于实际文档的多样性,复杂性,因此,目前还没有一个固定的,最优的切割模型。

  8.字符切割:

  - 由于拍照条件的限制,经常造成字符粘连,断笔,因此极大限制了识别系统的性能。

  9.字符识别:

  - 这一研究已经是很早的事情了,比较早有模板匹配,后来以特征提取为主,由于文字的位移,笔画的粗细,断笔,粘连,旋转等因素的影响,极大影响特征的提取的难度。

  10.版面还原:

  - 人们希望识别后的文字,仍然像原文档图片那样排列着,段落不变,位置不变,顺序不变地输出到Word文档、PDF文档等,这一过程就叫做版面还原。

  11.后处理、校对:

  - 根据特定的语言上下文的关系,对识别结果进行校正,就是后处理。

使用说明

  1、打开我们下载好的天若ocr文字识别工具,我们可以发现它的界面非常简单。这时候会出现一个对话框,我们直接选择“从图片读文件”。

  2、然后我们在出现的选择框内选定需要转换的文件,这里我们可以预览图片。选定需要转换的图片后,直接点击“打开”即可。

  3、等图片打开后,我们可以开始识别了。只需点击工具栏中的“识别”按钮,软件马上自动开始对图片识别,不一会儿就会把结果展现在右边。

  4、我们把识别结果和原图进行比较,有错误的话直接在识别结果上进行改正。等到核对无误后,按下“Word”按钮,就能马上自动生成一个Word文档了。这样复制图片上的文字就完成了。

  在天若ocr文字识别工具的帮助下,我们就可以说复制图片上的文字变得非常简单了。看来以后我们不需要自己辛辛苦苦的打字了,只需天若ocr文字识别工具,就能全部搞定了,实在是很方便。

更新日志

  1、安装程序功能新增英文版和中文版两种过程;

  2、软件部分Icon、UI更新设计 ;

  3、新增文档显示的鼠标移动,文字说明功能;

  4、优化文件打开报错bug;

  5、完善用户体验。

大家还下载了