python

关注公众号 jb51net

关闭
首页 > 脚本专栏 > python > Python Cv2验证码识别

Python使用Cv2模块识别验证码的操作方法

作者:业里村牛欢喜

这篇文章主要介绍了Python使用Cv2模块识别验证码,使用Cv2模块、pytesseract模块进行操作,pytesseract模块将智能识别图片字体数字,用于打印出来,本文通过代码案例给大家详细讲解,需要的朋友可以参考下

业务需求

        识别验证码图片中的数字信息,用python的图形表示出来了

需求分析

        使用Cv2模块、pytesseract模块进行操作。CV2是计算机建模识别的库,用来给图像进行灰度处理,降噪处理,形态学分析。pytesseract模块将智能识别图片字体数字,用于打印出来。

代码一

# -*- conding:utf-8 -*-
#二维码识别,呈现不同效果。
#导入计算机学习开源数据库
import cv2 as cv
#导入计算机识别模块
import pytesseract
#导入图像模块,形成图像
from PIL import Image
#定义函数,导入图像
def recognize_text(image):
    #边缘保留滤波,去除噪
    dst = cv.pyrMeanShiftFiltering(image,sp=10,sr=150)
    #灰度图像
    gray = cv.cvtColor(dst,cv.COLOR_BGR2GRAY)
    #图像二值化
    ret,binary = cv.threshold(gray,0,225,cv.THRESH_BINARY_INV | cv.THRESH_OTSU)
    #形态学操作 ,腐蚀,膨胀
    erode = cv.erode(binary,None,iterations=2)
    dilate = cv.dilate(erode,None,iterations=1)
    #逻辑运算,背景设置为白色,字体为黑色,便于识别
    cv.imshow('dilate',dilate)
    cv.bitwise_not(dilate,dilate)
    cv.imshow('binary-image',dilate)
    #识别图像
    test_message = Image.fromarray(dilate)
    text = pytesseract.image_to_string(test_message)
    print(f'define result:{text}')
#导入图像
src = cv.imread(r'./image.png')
#显示图像名字为input image,第二个是导入的图像。
cv.imshow('input image',src)
#调取函数导入图像
recognize_text(src)
cv.waitKey(0)
cv.destroyWindow()

结果分析

        导入的原图image的图片情况: 

编译结果呈现:

 代码二

验证码图片Image5.png:

代码模块

import cv2 as cv
import pytesseract
from PIL import Image
 
 
def recognize_text(image):
    # 边缘保留滤波  去噪
    blur = cv.pyrMeanShiftFiltering(image, sp=8, sr=60)
    cv.imshow('dst', blur)
    # 灰度图像
    gray = cv.cvtColor(blur, cv.COLOR_BGR2GRAY)
    # 二值化
    ret, binary = cv.threshold(gray, 0, 255, cv.THRESH_BINARY_INV | cv.THRESH_OTSU)
    print(f'二值化自适应阈值:{ret}')
    cv.imshow('binary', binary)
    # 形态学操作  获取结构元素  开操作
    kernel = cv.getStructuringElement(cv.MORPH_RECT, (3, 2))
    bin1 = cv.morphologyEx(binary, cv.MORPH_OPEN, kernel)
    cv.imshow('bin1', bin1)
    kernel = cv.getStructuringElement(cv.MORPH_OPEN, (2, 3))
    bin2 = cv.morphologyEx(bin1, cv.MORPH_OPEN, kernel)
    cv.imshow('bin2', bin2)
    # 逻辑运算  让背景为白色  字体为黑  便于识别
    cv.bitwise_not(bin2, bin2)
    cv.imshow('binary-image', bin2)
    # 识别
    test_message = Image.fromarray(bin2)
    text = pytesseract.image_to_string(test_message)
    print(f'识别结果:{text}')
 
 
src = cv.imread(r'./image5.png')
cv.imshow('input image', src)
recognize_text(src)
cv.waitKey(0)
cv.destroyAllWindows()

结果呈现

总结经验

cv2,pytesseract的使用不复杂了,按照官方操作手册来使用即可。安装时候记得更换一下源的地址,有一些官方的源不容易搜索到CV2和pytesseract模块了,要更换地址源才可以用。不过代码模块只能识别图片中的数字,对图片中的中文还没有识别出来。可能需要重新写代码。

 参考文献

使用Python中的pytesseract模块实现抓取图片中文字

Py之cv2:cv2(OpenCV,opencv-python)库的简介、安装、使用方法(常见函数、图像基本运算等)最强详细攻略

anaconda安装open cv

Python代码实现验证码识别

到此这篇关于Python使用Cv2模块识别验证码的文章就介绍到这了,更多相关Python Cv2验证码识别内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:
阅读全文