python实现图像最近邻插值
作者:机器学习入坑者
引言:
最近邻插值Nearest Neighbour Interpolate
算法是图像处理中普遍使用的图像尺寸缩放算法,由于其实现简单计算速度快的特性深受工程师们的喜爱。
图像插值技术是图像超分辨率领域的重要研究方法之一,其目的是根据已有的低分辨率图像(Low Resolution,LR)获得高分辨率图像(High Resolution,HR)。
本文一方面对最邻近插值算法的流程进行分析,另一方面借助python实现基本的最近邻插值算法。
注:网上的资料有的翻译是“近邻”,也有的翻译是“临近”。
1、最近邻插值算法思想
插值的目的是根据已知的图像的像素值获得未知目标图像的像素值,插值变换过程如下图(PPT画的背景没去除)所示:
其中src
表示原始图像,tar表示插值得到的目标图像,H和W分别表示图像的高度和宽度。插值的核心是找到(tar_x, tar_y)和(src_x, src_y)的映射关系,从而实现对目标图像的每一个像素点进行赋值。假设目的是将原始图像长度和宽度扩大(3,4)倍,即:
ratio_H = tar_H/src_H = tar_x/src_x = 3 ratio_W = tar_W/src_W = tar_y/src_y = 4
通过上式变形,得到目标图像的像素点和原始图像的像素点映射如下:
tar_x = src_x/ratio_H tar_y = src_y/ratio_W
知道了像素点之间的映射关系,实现算法就很容易了,算法流程如下:
- (1)根据tar_H和tar_W创建目标图像
- (2)计算缩放比例因子ratio
- (3)遍历目标图像每个像素点,计算映射关系
- (4)遍历目标图像每个像素点,使用对应原始图像的对应像素点对其赋值
2、python实现最邻近插值
有了前面的理论分析就很容易实现了,自己实现中比较难理解的地方就是“坐标变换关系”!如果是将原始图像放大整数倍很容易理解,比如一张原始10x10图像放大到目标20x20图像,那么20x20图像中的任一个像素点(tar_x,tar_y)的值来自原始10x10图像的(src_x,src_y)=int(tar_x/2, tar_y/2)
,也就是正好是除以2的位置;然而经常需要放大的倍数是小数倍,比如将10x10放大到15x15,这样(tar_x,tar_y)的值来自10x10图像中(src_x, src_y)=int(tar_x/1.5, tar_y/1.5)。
代码如下:
def nearest(image, target_size): """ Nearest Neighbour interpolate for RGB image :param image: rgb image :param target_size: tuple = (height, width) :return: None """ if target_size[0] < image.shape[0] or target_size[1] < image.shape[1]: raise ValueError("target image must bigger than input image") # 1:按照尺寸创建目标图像 target_image = np.zeros(shape=(*target_size, 3)) # 2:计算height和width的缩放因子 alpha_h = target_size[0]/image.shape[0] alpha_w = target_size[1]/image.shape[1] for tar_x in range(target_image.shape[0]-1): for tar_y in range(target_image.shape[1]-1): # 3:计算目标图像人任一像素点 # target_image[tar_x,tar_y]需要从原始图像 # 的哪个确定的像素点image[src_x, xrc_y]取值 # 也就是计算坐标的映射关系 src_x = round(tar_x/alpha_h) src_y = round(tar_y/alpha_w) # 4:对目标图像的任一像素点赋值 target_image[tar_x, tar_y] = image[src_x, src_y] return target_image
得到的插值结果的插值结果如下:
可以看出插值以后的图像明显存在锯齿效应,很多地方出现了“方格”。
到此这篇关于python实现图像最近邻插值的文章就介绍到这了,更多相关python图像邻插值内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!