详解如何使用opencv实现图片相似度检测
作者:默默努力的小老弟
1.为什么学这个,我对图像处理非常感兴趣,我联想到海尔的指纹识别门锁是如何进行检测的,我在想不应该呀,单片机性能这么差,应该是使用了训练后的数据去检测图片的,如果我要实现草莓检测,知道它是不是草莓,我觉得单纯使用图片处理是不够的,我考虑过使用指纹模块来接触草莓从而实现判断他是不是草莓,从而联想到学习图像相似度检测,我们人类的手指事实上是有大量的传感器的,机器如果想要实现那科技含量太高了,而且成本高,就算实现了也只能放在家里自己玩…
2.代码基于python3.1 opencv,先使用直方图判断是否是简单的图形(运算快)如果不是在判断是否是复杂的图形(运算慢)
import cv2 def calculate_complexity_similarity(img1str, img2str): # 加载两张图片 img1 = cv2.imread(img1str) img2 = cv2.imread(img2str) # 将图片转换为灰度图像 gray_img1 = cv2.cvtColor(img1, cv2.COLOR_BGR2GRAY) gray_img2 = cv2.cvtColor(img2, cv2.COLOR_BGR2GRAY) # 创建ORB特征检测器 orb = cv2.ORB_create() # 检测特征点和描述符 kp1, des1 = orb.detectAndCompute(gray_img1, None) kp2, des2 = orb.detectAndCompute(gray_img2, None) # 创建暴力匹配器 bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=True) # 进行特征匹配 matches = bf.match(des1, des2) similarity=0.0 # 根据特征点匹配结果计算相似度 if len(matches) > 0: similarity = sum([match.distance for match in matches]) / len(matches) print('图片相似度为:', similarity) else: print('未找到匹配的特征点') # 调用函数进行图片相似度计算,计算简单的图片相似度 return similarity def calculate_histogram_similarity(img1_path, img2_path): # 读取两张图片 img1 = cv2.imread(img1_path, cv2.IMREAD_GRAYSCALE) img2 = cv2.imread(img2_path, cv2.IMREAD_GRAYSCALE) # 计算直方图 hist1 = cv2.calcHist([img1], [0], None, [256], [0, 256]) hist2 = cv2.calcHist([img2], [0], None, [256], [0, 256]) # 归一化直方图 cv2.normalize(hist1, hist1, 0, 1, cv2.NORM_MINMAX) cv2.normalize(hist2, hist2, 0, 1, cv2.NORM_MINMAX) # 比较直方图 similarity = cv2.compareHist(hist1, hist2, cv2.HISTCMP_CORREL) if similarity<0.6: similarity=calculate_complexity_similarity(img1str, img2str) return similarity if __name__ == '__main__': img1str='straw1.png' img2str='straw3.png' sim = calculate_histogram_similarity(img1str, img2str) print('图片相似度为:', sim)
3.测试效果
简单的图片使用直方图归一化处理
不同的图片之间比较
2和22比较
2和23无法检测出来,可能是2个2颜色不一样,2和24也一样
straw1和straw2 这两张是在一张图片的两颗草莓
图片相似度为: 0.8582924959300794
traw1和straw3,不同图片的草莓
图片相似度为: 69.67826086956522
与倒立的草莓
图片相似度为: 68.84821428571429
图片相似度为: 73.10416666666667
带有草莓花的草莓,比较符合实际情况
图片相似度为: 0.7757366241694935
啊这汽车和草莓是相似的?而且是多个草莓,改了下代码 如果形状都不同了,similarity<0直接返回
4.改进后的代码
import cv2 def calculate_complexity_similarity(img1str, img2str): # 加载两张图片 img1 = cv2.imread(img1str) img2 = cv2.imread(img2str) # 将图片转换为灰度图像 gray_img1 = cv2.cvtColor(img1, cv2.COLOR_BGR2GRAY) gray_img2 = cv2.cvtColor(img2, cv2.COLOR_BGR2GRAY) # 创建ORB特征检测器 orb = cv2.ORB_create() # 检测特征点和描述符 kp1, des1 = orb.detectAndCompute(gray_img1, None) kp2, des2 = orb.detectAndCompute(gray_img2, None) # 创建暴力匹配器 bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=True) # 进行特征匹配 matches = bf.match(des1, des2) similarity=0.0 # 根据特征点匹配结果计算相似度 if len(matches) > 0: similarity = sum([match.distance for match in matches]) / len(matches) print('图片相似度为:', similarity) else: print('未找到匹配的特征点') # 调用函数进行图片相似度计算,计算简单的图片相似度 return similarity def calculate_histogram_similarity(img1_path, img2_path): # 读取两张图片 img1 = cv2.imread(img1_path, cv2.IMREAD_GRAYSCALE) img2 = cv2.imread(img2_path, cv2.IMREAD_GRAYSCALE) # 计算直方图 hist1 = cv2.calcHist([img1], [0], None, [256], [0, 256]) hist2 = cv2.calcHist([img2], [0], None, [256], [0, 256]) # 归一化直方图 cv2.normalize(hist1, hist1, 0, 1, cv2.NORM_MINMAX) cv2.normalize(hist2, hist2, 0, 1, cv2.NORM_MINMAX) # 比较直方图 similarity = cv2.compareHist(hist1, hist2, cv2.HISTCMP_CORREL) print(similarity) #30%的几率是那应该不是一个东西 if similarity <0.3: return similarity if similarity<0.6: similarity=calculate_complexity_similarity(img1str, img2str) return similarity if __name__ == '__main__': img1str='straw4.png' img2str='straw7.png' sim = calculate_histogram_similarity(img1str, img2str) print('图片相似度为:', sim)
改进后的结果
不同的形状的都返回负数
图片相似度为: -0.07563206074940822
5.根据评论区网友的建议进行测试
1.白描、素描、水彩 均不能识别
2.显微镜(基本识别得出)和草莓酱(有几率识别70%,颜色太深识别不出,需要大数据来对比)
3.一堆草莓 可以识别出来
能识别显微镜下
不能识别,添加了很多其他材料,或者是放太久果酱颜色变深
可以识别
加个干扰因素,和多个草莓 64%识别出来
5.以后改进的地方,上面的代码可以简单的检测颜色相同形状相同的问题,但是也面临着检测精度的不精确,我们可以录入多个图片如果取相似度最高的一张,当然性能不大好, 识别苹果和草莓达到40%相似率
其实我们不需要自己下载所有图片来提高精确度,我们只需要和网络上的1000张图片对比,基本可以确定这个图片是不是我们要的草莓,这个思路也可以用在识别其他物体…
- 使用模糊的图片识别工具,识别图片是什么
- 使用我的代码,假设上面识别出草莓,就拿原来图片和百度的大量图片进行对比,取准确率最高的值在1000张图片中
- 假设上面识别错误,识别为人,也按照2的方法对比,返回错误结果,并且使用一个关键字文本写上生活中常见的物体,一一查询
- 其实最重要的是防止重复性的工作,还是需要图片训练,生成模型文件…
6.结论,这个案例仅仅只能实现简单的图片识别功能,并不能识别物体的区域,其实我们可以通过逐步缩小图片的范围来确定物体的位置,我发现使用多维数组来处理图片不是一个明智的选择,还得发现他们函数关系,多个图片又有多个函数关系…,一个图片有多个草莓怎么办…
7.改进,可以任意尺寸图片进行识别
import cv2 import numpy as np def calculate_complexity_similarity(img1_path, img2_path): # 加载两张图片 img1 = cv2.imread(img1_path) img2 = cv2.imread(img2_path) # 将图片转换为灰度图像 gray_img1 = cv2.cvtColor(img1, cv2.COLOR_BGR2GRAY) gray_img2 = cv2.cvtColor(img2, cv2.COLOR_BGR2GRAY) # 创建ORB特征检测器 orb = cv2.ORB_create() # 检测特征点和描述符 kp1, des1 = orb.detectAndCompute(gray_img1, None) kp2, des2 = orb.detectAndCompute(gray_img2, None) # 将描述符类型转换为CV_8U des1 = np.uint8(des1) des2 = np.uint8(des2) # 创建暴力匹配器 bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=True) # 进行特征匹配 matches = bf.match(des1, des2) similarity = 0.0 # 根据特征点匹配结果计算相似度 if len(matches) > 0: similarity = sum([match.distance for match in matches]) / len(matches) print('图片相似度为:', similarity) else: print('未找到匹配的特征点') return similarity def calculate_histogram_similarity(img1_path, img2_path): # 读取两张图片 img1 = cv2.imread(img1_path, cv2.IMREAD_GRAYSCALE) img2 = cv2.imread(img2_path, cv2.IMREAD_GRAYSCALE) # 计算直方图 hist1 = cv2.calcHist([img1], [0], None, [256], [0, 256]) hist2 = cv2.calcHist([img2], [0], None, [256], [0, 256]) # 归一化直方图 cv2.normalize(hist1, hist1, 0, 1, cv2.NORM_MINMAX) cv2.normalize(hist2, hist2, 0, 1, cv2.NORM_MINMAX) # 比较直方图 similarity = cv2.compareHist(hist1, hist2, cv2.HISTCMP_CORREL) if similarity < 0.2: return similarity if similarity < 0.6: # 检查ORB描述符是否可用,若不可用则直接返回较低的相似度值 orb = cv2.ORB_create() kp1, des1 = orb.detectAndCompute(img1, None) kp2, des2 = orb.detectAndCompute(img2, None) if des1 is None or des2 is None: print('未找到足够的特征点') return 0.1 # 转换描述符类型 des1 = np.uint8(des1) des2 = np.uint8(des2) # 进行特征匹配 bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=True) matches = bf.match(des1, des2) orb_similarity = 0.0 if len(matches) > 0: orb_similarity = sum([match.distance for match in matches]) / len(matches) print('ORB图片相似度为:', orb_similarity) else: print('未找到匹配的特征点') return orb_similarity return similarity if __name__ == '__main__': img1_path = 'pic/straw1.png' img2_path = 'pic/smstraw1.png' sim = calculate_histogram_similarity(img1_path, img2_path) print('图片相似度为:', sim)
8.识别多颗草莓,就需要把一张图片分为多个区域,然后分别识别,比如我下面草莓分为4个区域去识别
代码
import cv2 import numpy as np def calculate_complexity_similarity(img1_path, img2_path): # 加载两张图片 img1 = cv2.imread(img1_path) img2 = cv2.imread(img2_path) # 将图片转换为灰度图像 gray_img1 = cv2.cvtColor(img1, cv2.COLOR_BGR2GRAY) gray_img2 = cv2.cvtColor(img2, cv2.COLOR_BGR2GRAY) # 创建ORB特征检测器 orb = cv2.ORB_create() # 检测特征点和描述符 kp1, des1 = orb.detectAndCompute(gray_img1, None) kp2, des2 = orb.detectAndCompute(gray_img2, None) # 将描述符类型转换为CV_8U des1 = np.uint8(des1) des2 = np.uint8(des2) # 创建暴力匹配器 bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=True) # 进行特征匹配 matches = bf.match(des1, des2) similarity = 0.0 # 根据特征点匹配结果计算相似度 if len(matches) > 0: similarity = sum([match.distance for match in matches]) / len(matches) print('图片相似度为:', similarity) else: print('未找到匹配的特征点') return similarity def calculate_histogram_similarity(img1_path, img2_path): # 读取两张图片 img1 = cv2.imread(img1_path, cv2.IMREAD_GRAYSCALE) img2 = cv2.imread(img2_path, cv2.IMREAD_GRAYSCALE) # 计算直方图 hist1 = cv2.calcHist([img1], [0], None, [256], [0, 256]) hist2 = cv2.calcHist([img2], [0], None, [256], [0, 256]) # 归一化直方图 cv2.normalize(hist1, hist1, 0, 1, cv2.NORM_MINMAX) cv2.normalize(hist2, hist2, 0, 1, cv2.NORM_MINMAX) # 比较直方图 similarity = cv2.compareHist(hist1, hist2, cv2.HISTCMP_CORREL) if similarity < 0.2: return similarity # 将第二个图片切割为4个区域并分别计算相似度 h, w = img2.shape[:2] img2_1 = img2[:h // 2, :w // 2] img2_2 = img2[:h // 2, w // 2:] img2_3 = img2[h // 2:, :w // 2] img2_4 = img2[h // 2:, w // 2:] sim_list = [] # 创建ORB特征检测器 orb = cv2.ORB_create() kp1, des1 = orb.detectAndCompute(img1, None) # 计算四个区域的相似度 for img in [img2_1, img2_2, img2_3, img2_4]: kp2, des2 = orb.detectAndCompute(img, None) if des1 is None or des2 is None: print('未找到足够的特征点') sim_list.append(0.1) else: des1 = np.uint8(des1) des2 = np.uint8(des2) bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=True) matches = bf.match(des1, des2) orb_similarity = 0.0 if len(matches) > 0: orb_similarity = sum([match.distance for match in matches]) / len(matches) sim_list.append(orb_similarity) max_sim = max(sim_list) print('图片相似度为:', max_sim) return max_sim if __name__ == '__main__': img1_path = 'pic/straw1.png' img2_path = 'pic/straw2.png' # 加载两张图片 img1 = cv2.imread(img1_path) img2 = cv2.imread(img2_path) # 计算ORB特征相似度 orb_similarity = calculate_complexity_similarity(img1_path, img2_path) # 计算直方图相似度 hist_similarity = calculate_histogram_similarity(img1_path, img2_path) # 将第二张图片切割为4个区域 h, w = img2.shape[:2] img2_1 = img2[:h // 2, :w // 2] img2_2 = img2[:h // 2, w // 2:] img2_3 = img2[h // 2:, :w // 2] img2_4 = img2[h // 2:, w // 2:] # 在图片上绘制绿色框和相似度 cv2.rectangle(img2, (0, 0), (w // 2, h // 2), (0, 255, 0), 2) cv2.putText(img2, f" {orb_similarity:.2f}", (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2) cv2.rectangle(img2, (w // 2, 0), (w, h // 2), (0, 255, 0), 2) cv2.putText(img2, f" {hist_similarity:.2f}", (w // 2 + 10, 30), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2) cv2.rectangle(img2, (0, h // 2), (w // 2, h), (0, 255, 0), 2) cv2.putText(img2, f" {orb_similarity:.2f}", (10, h // 2 + 30), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2) cv2.rectangle(img2, (w // 2, h // 2), (w, h), (0, 255, 0), 2) cv2.putText(img2, f" {hist_similarity:.2f}", (w // 2 + 10, h // 2 + 30), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2) # 显示结果图片 cv2.namedWindow('Image', cv2.WINDOW_NORMAL) cv2.resizeWindow('Image', 800, 600) cv2.imshow('Image', cv2.resize(img2, (0, 0), fx=0.5, fy=0.5)) cv2.waitKey(0) cv2.destroyAllWindows()
以上就是详解如何使用opencv实现图片相似度检测的详细内容,更多关于opencv图片相似度检测的资料请关注脚本之家其它相关文章!