Python 图像处理 Pillow 库详情
作者:木头人
前言:
图像处理是常用的技术,python
拥有丰富的第三方扩展库,Pillow 是 Python3 最常用的图像处理库,目前最高版本5.2.0。Python2 使用Pil库,两者是使用方法差不多,区别在于类的引用不同。
注意:Pil 库与 Pillow 不能同时存在与一个环境中,如果你已经安装 Pil 库,那么请将他卸载。
使用 pip 安装 Pillow:
> pip install Pillow
一、使用 Image.open() 创建图像实例
Image
是 Pillow
最常用的类,他可以通过多种方式创建图像实例。
“ from PIL import Image ”导入 Image 模块。然后通过 Image 类中的 open 函数即可载入图像文件, open 函数会自动判断图片格式,只需指定文件位置即可。成功,open 函数返回一个 Image 对象;载入文件失败,则会引起 IOError 异常 。
1. 通过文件创建 Image 对象
通过文件创建 Image
图像对象是最常用的方法
示例:通过文件创建 Image 图像对象
from PIL import Image image = Image.open('python-logo.png') # 创建图像实例 # 查看图像实例的属性 print(image.format, image.size, image.mode) image.show() # 显示图像
代码解读:
实例属性说明:
format 图像格式
size 图像的 (宽,高) 元组
mode 常见模式,默认 RGB 真彩图像;L 为灰阶图像;CMYK 印刷色彩;RGBA 带透明度的真彩图像;YCbCr 彩色视频格式;LAB L * a * b颜色空间;HSV 等。
show() 方法为使用系统默认图片查看器显示图像,一般用于调试;
2. 从打开文件中读取
可以从文件对象读取而不是文件名,但文件对象必须实现 read( )
,seek( )
和 tell( )
方法,并且是以二进制模式打开。
示例:从文件对象中读取图像
from PIL import Image with open("hopper.ppm", "rb") as fp: im = Image.open(fp)
2. 从 string 二进制流中读取
要从字符串数据中读取图像,需使用 io 类:
import io from PIL import Image im = Image.open(io.StringIO(buffer))
注意:在读取图像 header 之前将文件倒回(使用 seek(0) )。
3. 从tar文件中读取
from PIL import TarIO fp = TarIO.TarIO("Imaging.tar", "Imaging/test/lena.ppm") im = Image.open(fp)
二、读写图像
1. 格式转换并保存图像
Image
模块中的 save
函数可以保存图片,除非你指定文件格式,否则文件的扩展名就是文件格式。
import os from PIL import Image image_path='python-logo.png' # 图片位置 f, e = os.path.splitext(image_path) # 获取文件名与后缀 outfile = f + ".jpg" if image_path != outfile: try: Image.open(image_path).save(outfile) # 修改文件格式 except IOError: print("cannot convert", image_path)
注意: 如果你的图片mode是RGBA那么会出现异常,因为 RGBA 意思是红色,绿色,蓝色,Alpha 的色彩空间,Alpha 是指透明度。而 JPG 不支持透明度 ,所以要么丢弃Alpha , 要么保存为.png文件。解决方法将图片格式转换:
Image.open(image_path).convert("RGB").save(outfile) # convert 转换为 RGB 格式,丢弃Alpha
save()
函数有两个参数,如果文件名没有指定图片格式,那么第二个参数是必须的,他指定图片的格式。
2. 创建缩略图
创建缩略图 使用 Image.thumbnail( size )
, size
为缩略图宽长元组。
示例: 创建缩略图
import os from PIL import Image image_path = 'python-logo.png' # 图片位置 size = (128, 128) # 文件大小 f, e = os.path.splitext(image_path) # 获取文件名与后缀 outfile = f + ".thumbnail" if image_path != outfile: try: im = Image.open(image_path) im.thumbnail(size) # 设置缩略图大小 im.save(outfile, "JPEG") except IOError: print("cannot convert", image_path)
注意: 出现异常,同上一个示例,convert("RGB")转换图片mode。
注意:除非必须,Pillow不会解码或栅格数据。当你打开文件,Pillow通过文件头确定文件格式,大小,mode等数据,余下数据直到需要时才处理。这意味着打开文件非常快速,它与文件大小和压缩格式无关。
三、剪贴,粘贴、合并图像
Image
类包含允许您操作图像中的区域的方法。
如:要从图像中复制子矩形图像使用 crop() 方法。
1. 从图像复制子矩形
示例: 截取矩形图像
box = (100, 100, 400, 400) region = im.crop(box)
定义box元组,表示图像基于左上角为(0,0)的坐标,box
坐标为 (左,上,右,下)。注意,坐标是基于像素。示例中为 300 * 300 像素。
2. 处理子矩形并将其粘贴回来
示例: 在原图上粘贴子矩形图像
region = region.transpose(Image.ROTATE_180) # 颠倒180度 box = (400, 400, 700, 700) # 粘贴位置,像素必须吻合,300 * 300 im.paste(region, box)
注意:将子图(region) 粘贴(paste)回原图时,粘贴位置 box 的像素与宽高必须吻合。而原图和子图的 mode 不需要匹配,Pillow会自动处理。
示例:滚动图像
from PIL import Image def roll(image, delta): """ 向侧面滚动图像 """ xsize, ysize = image.size delta = delta % xsize if delta == 0: return image part1 = image.crop((0, 0, delta, ysize)) part2 = image.crop((delta, 0, xsize, ysize)) image.paste(part1, (xsize - delta, 0, xsize, ysize)) image.paste(part2, (0, 0, xsize - delta, ysize)) return image if __name__ == '__main__': image_path = 'test.jpg' im = Image.open(image_path) roll(im, 300).show() # 向侧面滚动 300 像素
3. 分离和合并通道
Pillow
允许处理图像的各个通道,例如RGB图像有R、G、B三个通道。 split
方法分离图像通道,如果图像为单通道则返回图像本身。merge 合并函数采用图像的 mode
和 通道元组为参数,将它们合并成新图像。
示例:交换RGB图像的三个波段
r, g, b = im.split() im = Image.merge("RGB", (b, g, r))
注意:如果要处理单色系,可以先将图片转换为'RGB‘
四. 几何变换
PIL.Image.Image
包含调整图像大小 resize()
和旋转 rotate()
的方法。前者采用元组给出新的大小,后者采用逆时针方向的角度。
示例:调整大小并逆时针旋转 45度
out = im.resize((128, 128)) out = out.rotate(45)
要以90度为单位旋转图像,可以使用 rotate()
或 transpose()
方法。后者也可用于围绕其水平轴或垂直轴翻转图像。
示例:
out = im.transpose(Image.FLIP_LEFT_RIGHT) # 水平左右翻转 out = im.transpose(Image.FLIP_TOP_BOTTOM) # 垂直上下翻转 out = im.transpose(Image.ROTATE_90) # 逆时针90度 out = im.transpose(Image.ROTATE_180) # 逆时针180度 out = im.transpose(Image.ROTATE_270) # 逆时针270度
rotate()
和 transpose()
方法相同,他们之间没有差别, transpose()
方法比较通用。
五. 颜色变换
示例:在 mode
之间转换
from PIL import Image im = Image.open("hopper.ppm").convert("L") # 转换为灰阶图像
注意:它支持每种模式转换为"L" 或 "RGB",要在其他模式之间进行转换,必须先转换模式(通常为“RGB”图像)。
六. 图像增强
1. Filters 过滤器
ImageFilter
模块有很多预定义的增强过滤器,通过 filter()
方法运用。
示例:使用 filter()
from PIL import ImageFilter out = im.filter(ImageFilter.DETAIL)
2. 像素点处理
point()
方法可用于转换图像的像素值(如对比度),在大多数情况下,可以将函数对象作为参数传递格此方法,它根据函数返回值对每个像素进行处理。
示例:每个像素点扩大1.2倍
out = im.point(lambda i: i * 1.2)
上述方法可以用简单的表达式进行图像处理,还可以通过组合 point()
和 paste()
对图像的局部区域进行处理 。
3. 处理单独通道
# 将通道分离 source = im.split() R, G, B = 0, 1, 2 # 选择红色小于100的区域 mask = source[R].point(lambda i: i < 100 and 255) # 处理绿色 out = source[G].point(lambda i: i * 0.7) # 粘贴已处理的通道,红色通道仅限于<100 source[G].paste(out, None, mask) # 合并图像 im = Image.merge(im.mode, source)
注意创建 mask 的语句:
imout = im.point(lambda i: expression and 255)
对于 and 逻辑判断来说,expression
为 False (0)
已经能证明整个表达式为 False (0)
, 否则还有对后面的结果进行判断。所以 expression
为 False (0)
返回 False (0)
,expression
为 True (本身的结果)是返回后面的 255;
同理对于 or 的逻辑判断,当前面的表达式为 True,返回前面的值;当前面表达式为 False,返回后面表达式的值。
七、高级增强
其他图像增强功能可以使用 ImageEnhance
模块中的类。从图像创建后,可以使用 ImageEnhance
快速调整图片的对比度、亮度、饱和度和清晰度。
from PIL import ImageEnhance enh = ImageEnhance.Contrast(im) # 创建调整对比度对象 enh.enhance(1.3).show("增加30%对比度")
ImageEnhance 方法类型:
ImageEnhance.Contrast(im) 对比度
ImageEnhance.Color(im) 色彩饱和度
ImageEnhance.Brightness(im) 亮度
ImageEnhance.Sharpness(im) 清晰度
八、 动态图像
Pillow
支持一些动态图像处理(如FLI/FLC,GIF等格式)。TIFF文件同样可以包含数帧图像。
打开动态图像时,PIL 会自动加载序列中的第一帧。你可以使用 seek
和 tell
方法在不同的帧之间移动。
示例: 读取动态图像
from PIL import Image im = Image.open("animation.gif") im.seek(1) # 跳到第二帧 try: while 1: im.seek(im.tell()+1) # tell() 获取当前帧的索引号 except EOFError: # 当读取到最后一帧时,Pillow抛出EOFError异常。 pass # 结束
注意:有些版本的库中的驱动程序仅允许您搜索下一帧。要回放文件,您可能需要重新打开它。都遇到无法回放的库时,可以使用 for 语句循环实现。
示例:for
使用 ImageSequence Iterator
类遍历动态图像
from PIL import ImageSequence for frame in ImageSequence.Iterator(im): # ...处理过程...
示例:保存动态图像
im.save(out, save_all=True, append_images=[im1, im2, ...])
参数说明:
out 需要保存到那个文件
save_all 为True,保存图像的所有帧。否则,仅保存多帧图像的第一帧。
append_images 需要附加为附加帧的图像列表。列表中的每个图像可以是单帧或多帧图像( 目前只有GIF,PDF,TIFF和WebP支持此功能)。
九、Postscript 打印
Pillow
允许通过 Postscript Printer
在图片上添加图像或文字。
from PIL import Image from PIL import PSDraw im = Image.open("test.jpg") title = "hopper" box = (1*72, 2*72, 7*72, 10*72) # in points ps = PSDraw.PSDraw() # 默认 sys.stdout ps.begin_document(title) # 画出图像 (75 dpi) ps.image(box, im, 75) ps.rectangle(box) # 画出标题 ps.setfont("HelveticaNarrow-Bold", 36) ps.text((3*72, 4*72), title)
十、配置加载器 draft
某些解码器允许在从文件中读取图像时对其进行操作。这通常可用于创建缩略图时(当速度比质量更重要)加速解码并打印到单色激光打印机(仅需灰阶图像时)。
draft()
方法操作已打开但尚未加载的图像,使其尽可能匹配给定的模式和大小。它通过重新配置图像解码器来完成。仅适用于JPEG和MPO
文件。
示例:使用 draft()
快速解码图像
from PIL import Image im = Image.open('test.jpg') print("original =", im.mode, im.size) im.draft("L", (100, 100)) print("draft =", im.mode, im.size)
输出:
original = RGB (1920, 1200) draft = L (240, 150)
注意: 生成的图像与请求的模式和大小可能不完全匹配。要确保图像不大于给定大小,需改用缩略图方法。