0 原理
霍夫变换在检测各种形状的的技术中非常流行,如果你要检测的形状可以用数学表达式写出,你就可以是使用霍夫变换检测它。及时要检测的形状存在一点破坏或者扭曲也可以使用。我们下面就看看如何使用霍夫变换检测直线。
首先将一条直线用一个点表示,这样用一个点表示直线上所有的点,一开始人们使用斜截式y=kx+q中的(k,q)来表示一条直线。
首先将一条直线用一个点表示,这样用一个点表示直线上所有的点,一开始人们使用斜截式y=kx+q中的(k,q)来表示一条直线。
变换后的空间成为霍夫空间。即:笛卡尔坐标系中一条直线,对应霍夫空间的一个点。
反过来同样成立(霍夫空间的一条直线,对应笛卡尔坐标系的一个点):
再来看看A、B两个点,对应霍夫空间的情形:
一步步来,再看一下三个点共线的情况:
可以看出如果笛卡尔坐标系的点共线,这些点在霍夫空间对应的直线交于一点:这也是必然,共线只有一种取值可能。
如果不止一条直线呢?再看看多个点的情况(有两条直线):
其实(3,2)与(4,1)也可以组成直线,只不过它有两个点确定,而图中A、B两点是由三条直线汇成,这也是霍夫变换的后处理的基本方式:选择由尽可能多直线汇成的点。
看看,霍夫空间:选择由三条交汇直线确定的点(中间图),对应的笛卡尔坐标系的直线(右图)。
到这里问题似乎解决了,已经完成了霍夫变换的求解,但是如果像下图这种情况呢?
但这样做会有一个弊端,那就是当直线趋近于垂直时,斜率a会趋近于无穷大。这一困难的解决方法之一就是使用法线来表示直线。
在极坐标系下,其实是一样的:极坐标的点→霍夫空间的正弦线,这条正弦线上的所有点都过极坐标中的那个点。
简单来说就是每个点在霍夫空间的弦线与其他点的弦线交一次,就会在累加器的ρθ平面中累加一次。下面的动画很好的演示了这个过程
1 OpenCV中的霍夫变换
上面介绍的整个过程在OpenCV中都被封装进了一个函数:cv2.HoughLines()。返回值就是极坐标表示的直线(ρ, θ)。ρ 的单位是像素,θ 的单位是弧度。
cv2.HoughLines(image, rho, theta, threshold, lines, sen, stn, min_theta, max_theta)
- image:输入图像,8-bit灰度图像
- rho:生成极坐标时候的像素扫描步长
- theta:生成极坐标时候的角度步长
- threshold:阈值,只有获得足够交点的极坐标点才被看成是直线
- lines:返回值,极坐标表示的直线(ρ, θ)
- sen:是否应用多尺度的霍夫变换,如果不是设置0表示经典霍夫变换
- stn:是否应用多尺度的霍夫变换,如果不是设置0表示经典霍夫变换
- min_theta:表示角度扫描范围最小值
- max_theta:表示角度扫描范围最大值
这种方法仅仅是一条直线都需要两个参数,这需要大量的计算。Probabilistic_Hough_Transform 是对霍夫变换的一种优化。它 不会对每一个点都进行计算,而是从一幅图像中随机选取(是不是也可以使用 图像金字塔呢?)一个点集进行计算,对于直线检测来说这已经足够了。但是 使用这种变换我们必须要降低阈值(总的点数都少了,阈值肯定也要小呀!)。
函数如下:
cv2.HoughLinesP(image, rho, theta, threshold, lines, minLineLength, maxLineGap)
- src:输入图像,必须8-bit的灰度图像
- rho:生成极坐标时候的像素扫描步长
- theta:生成极坐标时候的角度步长
- threshold:阈值,只有获得足够交点的极坐标点才被看成是直线
- lines:输出的极坐标来表示直线
- minLineLength:最小直线长度,比这个短的线都会被忽略。
- maxLineGap:最大间隔,如果小于此值,这两条直线 就被看成是一条直线。
举个例子:
import cv2 import numpy as npimg = cv2.imread('test19.jpg') img1 = img.copy() img2 = img.copy() img = cv2.GaussianBlur(img, (3, 3), 0) gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) edges = cv2.Canny(gray, 50, 150, apertureSize=3) lines = cv2.HoughLines(edges, 1, np.pi/180, 110)for line in lines:rho = line[0][0]theta = line[0][1]a = np.cos(theta)b = np.sin(theta)x0 = a*rhoy0 = b*rhox1 = int(x0 + 1000*(-b))y1 = int(y0 + 1000*(a))x2 = int(x0 - 1000*(-b))y2 = int(y0 - 1000*(a))cv2.line(img1, (x1, y1), (x2, y2), (0, 0, 255), 2)lines = cv2.HoughLinesP(edges, 1, np.pi/180, 30, 300, 5)for line in lines:x1 = line[0][0]y1 = line[0][1]x2 = line[0][2]y2 = line[0][3]cv2.line(img2, (x1, y1), (x2, y2), (0, 255, 0), 2)cv2.imshow('houghlines3', img1) cv2.imshow('edges', img2) cv2.waitKey(0) print(lines)
结果如下:
带有滑动条,用于调节HoughLines的参数
import cv2 import numpy as np from matplotlib import pyplot as pltdef nothing(x): # 滑动条的回调函数passsrc = cv2.imread('test19.jpg') srcBlur = cv2.GaussianBlur(src, (3, 3), 0) gray = cv2.cvtColor(srcBlur, cv2.COLOR_BGR2GRAY) edges = cv2.Canny(gray, 50, 150, apertureSize=3) WindowName = 'Approx' # 窗口名 cv2.namedWindow(WindowName, cv2.WINDOW_AUTOSIZE) # 建立空窗口cv2.createTrackbar('threshold', WindowName, 0, 60, nothing) # 创建滑动条while(1):img = src.copy()threshold = 100 + 2 * cv2.getTrackbarPos('threshold', WindowName) # 获取滑动条值lines = cv2.HoughLines(edges, 1, np.pi/180, threshold)for line in lines:rho = line[0][0]theta = line[0][1]a = np.cos(theta)b = np.sin(theta)x0 = a*rhoy0 = b*rhox1 = int(x0 + 1000*(-b))y1 = int(y0 + 1000*(a))x2 = int(x0 - 1000*(-b))y2 = int(y0 - 1000*(a))cv2.line(img, (x1, y1), (x2, y2), (0, 0, 255), 2)cv2.imshow(WindowName, img)k = cv2.waitKey(1) & 0xFFif k == 27:break cv2.destroyAllWindows()
结果如下:
带有滑动条,用于调节HoughLinesP的参数
import cv2 import numpy as np from matplotlib import pyplot as pltdef nothing(x): # 滑动条的回调函数passsrc = cv2.imread('test19.jpg') srcBlur = cv2.GaussianBlur(src, (3, 3), 0) gray = cv2.cvtColor(srcBlur, cv2.COLOR_BGR2GRAY) edges = cv2.Canny(gray, 50, 150, apertureSize=3) WindowName = 'Approx' # 窗口名 cv2.namedWindow(WindowName, cv2.WINDOW_AUTOSIZE) # 建立空窗口cv2.createTrackbar('threshold', WindowName, 0, 100, nothing) # 创建滑动条 cv2.createTrackbar('minLineLength', WindowName, 0, 100, nothing) # 创建滑动条 cv2.createTrackbar('maxLineGap', WindowName, 0, 100, nothing) # 创建滑动条while(1):img = src.copy()threshold = cv2.getTrackbarPos('threshold', WindowName) # 获取滑动条值minLineLength = 2 * cv2.getTrackbarPos('minLineLength', WindowName) # 获取滑动条值maxLineGap = cv2.getTrackbarPos('maxLineGap', WindowName) # 获取滑动条值lines = cv2.HoughLinesP(edges, 1, np.pi/180, threshold, minLineLength, maxLineGap)for line in lines:x1 = line[0][0]y1 = line[0][1]x2 = line[0][2]y2 = line[0][3]cv2.line(img, (x1, y1), (x2, y2), (0, 255, 0), 2)cv2.imshow(WindowName, img)k = cv2.waitKey(1) & 0xFFif k == 27:break cv2.destroyAllWindows()
结果如下: