Python中OTSU算法的原理与实现详解
作者:微小冷
OTSU算法是大津展之提出的阈值分割方法,又叫最大类间方差法,本文主要为大家详细介绍了OTSU算法的原理与Python实现,感兴趣的小伙伴可以了解下
原理
OTSU算法是大津展之提出的阈值分割方法,又叫最大类间方差法。OTSU并不是一个英文缩写,而是日语假名,是其提出者的姓氏“大津”。
假设存在阈值T可以将图像分为两部分,记二者均值为m1,m2,图像总均值为m,像素被分入这两部分的比例分别为p1,p2 。从而
p1+p2=1
p1m1+p2m2=m
则类间方差可表示为
σ2=p1(m1−m)2+p2(m2-m)2
=p1m12+p2m22-m2
实现和验证
由于OTSU算法的逻辑和公式都非常清晰,所以实现起来也及其方便
import numpy as np import matplotlib.pyplot as plt # 计算类间方差 def getVar(img, th): slct = img>th p1 = np.sum(slct)/img.size if p1 in [0, 1]: return 0 p2 = 1-p1 m1 = np.mean(img[slct]) m2 = np.mean(img[~slct]) m = p1*m1+p2*m2 return p1*m1**2+p2*m2**2-m**2 def otsu(img): vs = [getVar(img, th) for th in range(256)] return np.argmax(vs)
其中,getVar用于计算类间方差,后面的otsu则返回分割阈值。下面创建函数用于测试otsu算法
def drawOne(fig, index, img): fig.add_subplot(index) plt.imshow(img, cmap="gray") plt.axis('off') def test(): img = plt.imread(r"D:\Code\NotePL\python\lena.jpg").astype(float) img = np.mean(img, axis=2) th = otsu(img) print(th) fig = plt.figure(figsize=(8,3)) drawOne(fig, 131, img) drawOne(fig, 132, img>th) drawOne(fig, 133, img<=th) plt.tight_layout() plt.show()
效果如下
分析和优化
由于图像的像素值是八位整型,所以迭代256次就可以得到所有的类间方差。
img = plt.imread(r"D:\Code\NotePL\python\lena.jpg").astype(float) img = np.mean(img, axis=2) vs = [getVar(img, th) for th in range(256)] print(np.argmax(vs)) # 121 plt.plot(vs) plt.show()
类间方差分布如下,当阈值是121时,得到最大类间方差。
对于精度更高的16位图像,或者其他非图像的数值,遍历的方案效率太低了,为此可进行做一个步长二分的爬山算法,代码如下,最终得到的结果位121.7,由于在阈值分割时采用的是大于号,所以效果与121相同。
def climb(img, step, st=0, err=0.1): vSt = getVar(img, st) while abs(step)>err: ed = st+step vEd = getVar(img, ed) if vEd < vSt: step = -step/2 st, vSt = ed, vEd return ed climb(img, 40) # 121.71875
到此这篇关于Python中OTSU算法的原理与实现详解的文章就介绍到这了,更多相关Python OTSU算法内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!