第五章 深度学习
四、OpenCV
1. OpenCV安装
执行以下命令安装opencv-python库(核心库)和opencv-contrib-python库(贡献库)。注意:命令拷贝后要合成一行执行,中间不要换行。
# 安装opencv核心库
pip3 install --user opencv-python==4.3.0.38 --index-url https://pypi.tuna.tsinghua.edu.cn/simple/ --trusted-host https://pypi.tuna.tsinghua.edu.cn
# 安装opencv贡献库
pip3 install --user opencv-contrib-python==4.3.0.38 --index-url https://pypi.tuna.tsinghua.edu.cn/simple/ --trusted-host https://pypi.tuna.tsinghua.edu.cn
2. OpenCV基本操作
读取、图像、保存图像
# 读取图像
import cv2im = cv2.imread("../data/Linus.png", 1) # 1表示3通道彩色,0表示单通道灰度
cv2.imshow("test", im) # 在test窗口中显示图像print(type(im)) # 打印数据类型
print(im.shape) # 打印图像尺寸cv2.imwrite("../data/Linus_2.png", im) # 将图像保存到指定路径cv2.waitKey() # 等待用户按键反馈
cv2.destroyAllWindows() # 销毁所有创建的窗口"""
<class 'numpy.ndarray'>
(216, 160, 3)
"""
执行结果:
3. 图像色彩操作
3.1 彩色图像转换为灰度图像
# 彩色图像转换为灰度图像示例
import cv2im = cv2.imread("../data/Linus.png", 1)
cv2.imshow("RGB", im) # 在test窗口中显示图像# 使用cvtColor进行颜色空间变化,COLOR_BGR2GRAY表示BGR to GRAY
img_gray = cv2.cvtColor(im, cv2.COLOR_BGR2GRAY) # 彩色图像灰度化
cv2.imshow("Gray", img_gray)cv2.waitKey() # 等待用户按键反馈
cv2.destroyAllWindows() # 销毁所有创建的窗口
执行结果:
3.2 色彩通道操作
# 色彩通道操作:通道表示为BGR
import numpy as np
import cv2im = cv2.imread("../data/opencv2.png")
print(im.shape)
cv2.imshow("im", im)# 取出蓝色通道,当做单通道图像显示
b = im[:, :, 0]
cv2.imshow("b", b)# 去掉蓝色通道(索引为0的通道)
im[:, :, 0] = 0
cv2.imshow("im-b0", im)# 去掉绿色通道(索引为1的通道)
im[:, :, 1] = 0
cv2.imshow("im-b0g0", im)cv2.waitKey()
cv2.destroyAllWindows()
执行结果:
3.3 灰度直方图均衡化
# 直方图均衡化示例
import numpy as np
import cv2
from matplotlib import pyplot as pltim = cv2.imread("../data/sunrise.jpg", 0)
cv2.imshow("orig", im)# 直方图均衡化
im_equ = cv2.equalizeHist(im)
cv2.imshow("equ1", im_equ)# 绘制灰度直方图
## 原始直方图
print(im.ravel())
plt.subplot(2, 1, 1)
plt.hist(im.ravel(), #ravel返回一个连续的扁平数组256, [0, 256], label="orig")
plt.legend()## 均衡化处理后的直方图
plt.subplot(2, 1, 2)
plt.hist(im_equ.ravel(), 256, [0, 256], label="equalize")
plt.legend()plt.show()cv2.waitKey()
cv2.destroyAllWindows()
执行结果:
3.4 彩色亮度直方图均衡化
# 彩色图像亮度直方图均衡化
import cv2# 读取原始图片
original = cv2.imread('../data/sunrise.jpg')
cv2.imshow('Original', original)# BRG空间转换为YUV空间
# YUV:亮度,色度,饱和度,其中Y通道为亮度通道
yuv = cv2.cvtColor(original, cv2.COLOR_BGR2YUV)
print("yuv.shape:", yuv.shape)yuv[..., 0] = cv2.equalizeHist(yuv[..., 0]) # 取出亮度通道,均衡化并赋回原图像
equalized_color = cv2.cvtColor(yuv, cv2.COLOR_YUV2BGR)
cv2.imshow('Equalized Color', equalized_color)cv2.waitKey()
cv2.destroyAllWindows()
执行结果:
3.5 色彩提取
从图片中提取特定颜色
import cv2
import numpy as npim = cv2.imread("../data/opencv2.png")
hsv = cv2.cvtColor(im, cv2.COLOR_BGR2HSV)
cv2.imshow('opencv', im)# =============指定蓝色值的范围=============
# 蓝色H通道值为120,通常取120上下10的范围
# S通道和V通道通常取50~255间,饱和度太低、色调太暗计算出来的颜色不准确
minBlue = np.array([110, 50, 50])
maxBlue = np.array([130, 255, 255])
# 确定蓝色区域
mask = cv2.inRange(hsv, minBlue, maxBlue) # 选取出掩模
# cv2.imshow("mask", mask)
# 通过掩码控制的按位与运算,锁定蓝色区域
blue = cv2.bitwise_and(im, im, mask=mask) # 执行掩模运算
cv2.imshow('blue', blue)# =============指定绿色值的范围=============
minGreen = np.array([50, 50, 50])
maxGreen = np.array([70, 255, 255])
# 确定绿色区域
mask = cv2.inRange(hsv, minGreen, maxGreen)
# cv2.imshow("mask", mask)
# 通过掩码控制的按位与运算,锁定绿色区域
green = cv2.bitwise_and(im, im, mask=mask) # 执行掩模运算
cv2.imshow('green', green)# =============指定红色值的范围=============
minRed = np.array([0, 50, 50])
maxRed = np.array([30, 255, 255])
# 确定红色区域
mask = cv2.inRange(hsv, minRed, maxRed)
# cv2.imshow("mask", mask)
# 通过掩码控制的按位与运算,锁定红色区域
red = cv2.bitwise_and(im, im, mask=mask) # 执行掩模运算
cv2.imshow('red', red)cv2.waitKey()
cv2.destroyAllWindows()
执行结果:
3.6 二值化与反二值化
# 二值化处理
import cv2 as cv# 读取图像
img = cv.imread("../data/lena.jpg", 0)
cv.imshow("img", img) # 显示原始图像# 二值化
t, rst = cv.threshold(img, 127, 255, cv.THRESH_BINARY)
cv.imshow("rst", rst) # 显示二值化图像# 反二值化
t, rst2 = cv.threshold(img, 127, 255, cv.THRESH_BINARY_INV)
cv.imshow("rst2", rst2) # 显示反二值化图像cv.waitKey()
cv.destroyAllWindows()
执行结果:
4. 图像形态操作
4.1 图像翻转
# 图像翻转示例
import numpy as np
import cv2im = cv2.imread("../data/Linus.png")
cv2.imshow("src", im)# 0-垂直镜像
im_flip0 = cv2.flip(im, 0)
cv2.imshow("im_flip0", im_flip0)# 1-水平镜像
im_flip1 = cv2.flip(im, 1)
cv2.imshow("im_flip1", im_flip1)cv2.waitKey()
cv2.destroyAllWindows()
执行结果:
4.2 图像仿射变换
# 图像仿射变换
import numpy as np
import cv2def translate(img, x, y):"""坐标平移变换:param img: 原始图像数据:param x:平移的x坐标:param y:平移的y坐标:return:返回平移后的图像"""h, w = img.shape[:2] # 获取图像高、宽# 定义平移矩阵M = np.float32([[1, 0, x],[0, 1, y]])# 使用openCV仿射操作实现平移变换shifted = cv2.warpAffine(img, M, (w, h)) # 第三个参数为输出图像尺寸return shifted # 返回平移后的图像def rotate(img, angle, center=None, scale=1.0):"""图像旋转变换:param img: 原始图像数据:param angle: 旋转角度:param center: 旋转中心,如果为None则以原图中心为旋转中心:param scale: 缩放比例,默认为1:return: 返回旋转后的图像"""h, w = img.shape[:2] # 获取图像高、宽# 旋转中心默认为图像中心if center is None:center = (w / 2, h / 2)# 计算旋转矩阵M = cv2.getRotationMatrix2D(center, angle, scale)# 使用openCV仿射变换实现函数旋转rotated = cv2.warpAffine(img, M, (w, h))return rotated # 返回旋转后的矩阵if __name__ == "__main__":# 读取并显示原始图像im = cv2.imread("../data/Linus.png")cv2.imshow("SrcImg", im)# 图像向下移动50像素shifted = translate(im, 0, 50)cv2.imshow("Shifted1", shifted)# 图像向左移动40, 下移动40像素shifted = translate(im, -40, 40)cv2.imshow("Shifted2", shifted)# 逆时针旋转45度rotated = rotate(im, 45)cv2.imshow("rotated1", rotated)# 顺时针旋转180度rotated = rotate(im, -90)cv2.imshow("rorated2", rotated)cv2.waitKey()cv2.destroyAllWindows()
执行结果:
4.3 图像缩放
# 图像缩放示例
import numpy as np
import cv2im = cv2.imread("../data/Linus.png")
cv2.imshow("src", im)h, w = im.shape[:2] # 获取图像尺寸dst_size = (int(w/2), int(h/2)) # 缩放目标尺寸,宽高均为原来1/2
resized = cv2.resize(im, dst_size) # 执行缩放
cv2.imshow("reduce", resized)dst_size = (200, 300) # 缩放目标尺寸,宽200,高300
method = cv2.INTER_NEAREST # 最邻近插值
resized = cv2.resize(im, dst_size, interpolation=method) # 执行缩放
cv2.imshow("NEAREST", resized)dst_size = (200, 300) # 缩放目标尺寸,宽200,高300
method = cv2.INTER_LINEAR # 双线性插值
resized = cv2.resize(im, dst_size, interpolation=method) # 执行缩放
cv2.imshow("LINEAR", resized)cv2.waitKey()
cv2.destroyAllWindows()
执行结果:
4.4 图像裁剪
import numpy as np
import cv2# 图像随机裁剪
def random_crop(im, w, h):start_x = np.random.randint(0, im.shape[1]) # 裁剪起始x像素start_y = np.random.randint(0, im.shape[0]) # 裁剪起始y像素new_img = im[start_y:start_y + h, start_x: start_x + w] # 执行裁剪return new_img# 图像中心裁剪
def center_crop(im, w, h):start_x = int(im.shape[1] / 2) - int(w / 2) # 裁剪起始x像素start_y = int(im.shape[0] / 2) - int(h / 2) # 裁剪起始y像素new_img = im[start_y:start_y + h, start_x: start_x + w] # 执行裁剪return new_imgim = cv2.imread("../data/banana_1.png", 1)new_img = random_crop(im, 200, 200) # 随机裁剪
new_img2 = center_crop(im, 200, 200) # 中心裁剪cv2.imshow("orig", im)
cv2.imshow("random_crop", new_img)
cv2.imshow("center_crop", new_img2)cv2.waitKey()
cv2.destroyAllWindows()
执行结果:
4.5 图像相加
# 图像相加示例
import cv2a = cv2.imread("../data/lena.jpg", 0)
b = cv2.imread("../data/lily_square.png", 0)dst1 = cv2.add(a, b) # 图像直接相加,会导致图像过亮、过白# 加权求和:addWeighted
# 图像进行加权和计算时,要求src1和src2必须大小、类型相同
dst2 = cv2.addWeighted(a, 0.6, b, 0.4, 0) # 最后一个参数为亮度调节量cv2.imshow("a", a)
cv2.imshow("b", b)
cv2.imshow("dst1", dst1)
cv2.imshow("dst2", dst2)cv2.waitKey()
cv2.destroyAllWindows()
执行结果:
4.6 图像相减
# 图像相减运算示例
import cv2a = cv2.imread("../data/3.png", 0)
b = cv2.imread("../data/4.png", 0)dst = cv2.subtract(a, b) # 两幅图像相减,是求出图像的差异cv2.imshow("a", a)
cv2.imshow("b", b)
cv2.imshow("dst1", dst)cv2.waitKey()
cv2.destroyAllWindows()
执行结果:
4.7 透视变换
# 透视变换
import cv2
import numpy as npimg = cv2.imread('../data/pers.png')
rows, cols = img.shape[:2]
print(rows, cols)pts1 = np.float32([[58, 2], [167, 9], [8, 196], [126, 196]])# 输入图像四个顶点坐标
pts2 = np.float32([[16, 2], [167, 8], [8, 196], [169, 196]])# 输出图像四个顶点坐标# 生成透视变换矩阵
M = cv2.getPerspectiveTransform(pts1, # 输入图像四个顶点坐标pts2) # 输出图像四个顶点坐标
print(M.shape)
# 执行透视变换,返回变换后的图像
dst = cv2.warpPerspective(img, # 原始图像M, # 3*3的变换矩阵(cols, rows)) # 输出图像大小# 生成透视变换矩阵
M = cv2.getPerspectiveTransform(pts2, # 输入图像四个顶点坐标pts1) # 输出图像四个顶点坐标
# 执行透视变换,返回变换后的图像
dst2 = cv2.warpPerspective(dst, # 原始图像M, # 3*3的变换矩阵(cols, rows)) # 输出图像大小
cv2.imshow("img", img)
cv2.imshow("dst", dst)
cv2.imshow("dst2", dst2)cv2.waitKey()
cv2.destroyAllWindows()
执行结果:
4.8 图像腐蚀
# 图像腐蚀
import cv2
import numpy as np# 读取原始图像
im = cv2.imread("../data/5.png")
cv2.imshow("im", im)# 腐蚀
kernel = np.ones((3, 3), np.uint8) # 用于腐蚀计算的核
erosion = cv2.erode(im, # 原始图像kernel, # 腐蚀核iterations=3) # 迭代次数
cv2.imshow("erosion", erosion)cv2.waitKey()
cv2.destroyAllWindows()
执行结果:
4.9 图像膨胀
# 图像膨胀
import cv2
import numpy as np# 读取原始图像
im = cv2.imread("../data/6.png")
cv2.imshow("im", im)# 膨胀
kernel = np.ones((3, 3), np.uint8) # 用于膨胀计算的核
dilation = cv2.dilate(im, # 原始图像kernel, # 膨胀核iterations=5) # 迭代次数
cv2.imshow("dilation", dilation)cv2.waitKey()
cv2.destroyAllWindows()
执行结果:
4.10 图像开运算
# 开运算示例
import cv2
import numpy as np# 读取原始图像
im1 = cv2.imread("../data/7.png")
im2 = cv2.imread("../data/8.png")# 执行开运算
k = np.ones((10, 10), np.uint8)
r1 = cv2.morphologyEx(im1, cv2.MORPH_OPEN, k)
r2 = cv2.morphologyEx(im2, cv2.MORPH_OPEN, k)cv2.imshow("im1", im1)
cv2.imshow("result1", r1)cv2.imshow("im2", im2)
cv2.imshow("result2", r2)cv2.waitKey()
cv2.destroyAllWindows()
执行结果:
4.11 图像闭运算
# 闭运算示例
import cv2
import numpy as np# 读取图像
im1 = cv2.imread("../data/9.png")
im2 = cv2.imread("../data/10.png")# 闭运算
k = np.ones((8, 8), np.uint8)
r1 = cv2.morphologyEx(im1, cv2.MORPH_CLOSE, k, iterations=2)
r2 = cv2.morphologyEx(im2, cv2.MORPH_CLOSE, k, iterations=2)cv2.imshow("im1", im1)
cv2.imshow("result1", r1)
cv2.imshow("im2", im2)
cv2.imshow("result2", r2)cv2.waitKey()
cv2.destroyAllWindows()
执行结果:
4.11 形态学梯度
# 形态学梯度示例
import cv2
import numpy as npo = cv2.imread("../data/6.png")k = np.ones((3, 3), np.uint8)
r = cv2.morphologyEx(o, cv2.MORPH_GRADIENT, k)cv2.imshow("original", o)
cv2.imshow("result", r)cv2.waitKey()
cv2.destroyAllWindows()
执行结果: