Machine Vision Technology:Lecture2 Linear filtering

Machine Vision Technology:Lecture2 Linear filtering

    • Types of Images
    • Image denoising图像去噪
    • Defining convolution卷积的定义
    • Key properties卷积的关键属性
    • 卷积的其它属性
    • Annoying details
    • 卷积练习
    • Sharpening锐化
    • Gaussian Kernel
    • Noise噪声 分类
    • Gaussian noise高斯噪声
    • Reducing salt-and-pepper noise:Median filtering中值滤波
    • Sharpening revisited:再看锐化
    • Edge detection | Origin of edges
    • Characterzing edges描述边缘
    • Image gradient图像梯度

计算机视觉(本科) 北京邮电大学 鲁鹏


Types of Images

二进制图像Binary:黑白图像。0表示Black,1表示White。

灰度图像Grayscale:每个像素用范围在0-255的灰度值表示。

彩色图像Color:RGB三通道。

Image denoising图像去噪

Moving average移动平均:一种通过使用过去若干时间段的平均值计算得出的平均值。移动平均值会定期变化,最早的数值会被基于最新数据的数值所替代。

  • 用邻域的加权平均值替换每个像素
  • 权重被称为滤波器核 filter kernel

一个3x3的权重为平均值的滤波核:

在这里插入图片描述

Defining convolution卷积的定义

Let f be the image and g be the kernel. The output of convolving fwith g is denoted f * g.

f f f 为图像, g g g 为核, f f f g g g 的卷积输出定义为 f ∗ g f*g fg
( f ∗ g ) [ m , n ] = ∑ k , l f [ m − k , n − l ] g [ k , l ] (f*g)[m,n] = \sum_{k,l}{f[m-k, n-l]g[k,l]} (fg)[m,n]=k,lf[mk,nl]g[k,l]
对卷积进一步展开:
( f ∗ g ) [ m , n ] = ∑ k , l f [ m − k , n − l ] g [ k , l ] = ∑ k = − 1 k = 1 ∑ l = − 1 l = 1 f [ m − k , n − l ] g [ k , l ] \begin{align} (f*g)[m,n] &= \sum_{k,l}{f[m-k, n-l]g[k,l]} \\ &= \sum_{k=-1}^{k=1} \sum_{l=-1}^{l=1} {f[m-k, n-l]g[k,l]} \end{align} (fg)[m,n]=k,lf[mk,nl]g[k,l]=k=1k=1l=1l=1f[mk,nl]g[k,l]

假设有f为7x7,g为3x3的卷积核,此时k取-1、0、1,l取-1、0、1。

卷积示意图如下:

请添加图片描述

当m=2,n=2时:卷积操作如下
( f ∗ g ) [ 2 , 2 ] = ∑ k , l f [ 2 − k , 2 − l ] g [ k , l ] = ∑ k = − 1 k = 1 ∑ l = − 1 l = 1 f [ 2 − k , 2 − l ] g [ k , l ] = f [ 3 , 3 ] g [ − 1 , − 1 ] + f [ 3 , 2 ] g [ − 1 , 0 ] + f [ 3 , 1 ] g [ − 1 , 1 ] + f [ 2 , 3 ] g [ 0 , − 1 ] + f [ 2 , 2 ] g [ 0 , 0 ] + f [ 2 , 1 ] g [ 0 , 1 ] + f [ 1 , 3 ] g [ 1 , − 1 ] + f [ 1 , 2 ] g [ 1 , 0 ] + f [ 1 , 1 ] g [ 1 , 1 ] \begin{align} (f*g)[2,2] &= \sum_{k,l}{f[2-k, 2-l]g[k,l]} \\ &= \sum_{k=-1}^{k=1} \sum_{l=-1}^{l=1} {f[2-k, 2-l]g[k,l]} \\ &= f[3,3]g[-1,-1] + f[3,2]g[-1,0] + f[3,1]g[-1,1] \\ &+ f[2,3]g[0,-1] + f[2,2]g[0,0] + f[2,1]g[0,1] \\ &+ f[1,3]g[1,-1] + f[1,2]g[1,0] + f[1,1]g[1,1] \end{align} (fg)[2,2]=k,lf[2k,2l]g[k,l]=k=1k=1l=1l=1f[2k,2l]g[k,l]=f[3,3]g[1,1]+f[3,2]g[1,0]+f[3,1]g[1,1]+f[2,3]g[0,1]+f[2,2]g[0,0]+f[2,1]g[0,1]+f[1,3]g[1,1]+f[1,2]g[1,0]+f[1,1]g[1,1]

示意图如下:
请添加图片描述

卷积核是翻转的:ppt中的图给成了镜像翻转,但上面推导怎么是旋转180度?

请添加图片描述

Key properties卷积的关键属性

  • 线性性质Linearity: f i l t e r ( f 1 + f 2 ) = f i l t e r ( f 1 ) + f i l t e r ( f 2 ) filter(f_1 + f_2) = filter(f_1) + filter(f_2) filter(f1+f2)=filter(f1)+filter(f2)
  • 平移不变性Shift invariance: f i l t e r ( s h i f t ( f ) ) = s h i f t ( f i l t e r ( f ) ) filter(shift(f)) = shift(filter(f)) filter(shift(f))=shift(filter(f))
  • 理论结果Theoretical result:通过理论分析和计算得出的预测性结果:任何线性平移不变算子都可以表示为卷积

卷积的其它属性

  • 交换律Commutative: a ∗ b = b ∗ a a * b = b * a ab=ba

    从概念上讲,滤波器和信号没有区别

  • 结合律Associative: a ∗ ( b ∗ c ) = ( a ∗ b ) ∗ c a*(b*c)=(a*b)*c a(bc)=(ab)c

  • 分配律Distributes over addition: a ∗ ( b + c ) = a ∗ b + a ∗ c a*(b+c) = a*b + a*c a(b+c)=ab+ac

  • 标量因子提出Scalars factor out: k a ∗ b = a ∗ k b = k ( a ∗ b ) ka*b = a*kb = k(a*b) kab=akb=k(ab)

  • 同一性Identity:单位脉冲unit impulse e = [ . . . , 0 , 0 , 1 , 0 , 0 , . . . ] e = [..., 0,0,1,0,0,...] e=[...,0,0,1,0,0,...] a ∗ e = a a*e=a ae=a

Annoying details

卷积的输出结果与填充方式有关:在MATLAB中

filter2(g, f, shape)
  • shape='full':输出大小是f和g的和
  • shape='same':输出大小和f相同
  • shape='valid':输出大小是f和g的差

请添加图片描述

图像进行外推填充方式:

  • clip filter (black): imfilter(f, g, 0) 周围补一圈黑色,像素为0的黑边
  • wrap around: imfilter(f, g, ‘circular’) 图像右侧边缘补到左边,左侧边缘补到右边,类似圆筒,上下类似。
  • copy edge: imfilter(f, g, ‘replicate’) 拉伸边缘像素
  • reflect across edge: imfilter(f, g, ‘symmetric’) 镜像边缘像素

卷积练习

请添加图片描述

用右侧像素替代当前像素,相当于左移。

请添加图片描述

用box滤波器进行Blur模糊:

请添加图片描述

锐化滤波器Sharpening filter:突出和平均值的差异

请添加图片描述

Sharpening锐化

请添加图片描述

假设用 I I I 表示原图, e e e 表示单位脉冲,g表示box filter,上述过程表示如下:

原图减去滤波后的图: I ∗ e − I ∗ g = I ∗ ( e − g ) I*e - I*g = I*(e-g) IeIg=I(eg)

然后: I ∗ e + I ∗ ( e − g ) = I ∗ ( 2 e − g ) I*e + I*(e-g) = I*(2e - g) Ie+I(eg)=I(2eg)

所以可以用新的滤波器 2 e − g 2e-g 2eg 与原图进行卷积,直接得到sharpened图像。

请添加图片描述

Gaussian Kernel

为了消除边缘影响,根据邻近像素与中心的接近程度对其权重贡献。
G σ = 1 2 π σ 2 e − ( x 2 + y 2 ) 2 σ 2 G_{\sigma} = \frac{1}{2 \pi \sigma^2} e^{- \frac{(x^2 + y^2)}{2 \sigma^2}} Gσ=2πσ21e2σ2(x2+y2)
请添加图片描述

5x5高斯模版生成过程:

  • 中心坐标为(0,0),右边为(1,0),其余以此类推。
  • 将坐标的x和y带入高斯函数得到值。
  • 所有值还需要进行归一化(某个值除以所有值的和)。

模版的所有值加和为1,使模版操作不改变图像亮度。


  • 标准偏差 σ \sigma σ 决定平滑程度
  • 当固定模版的大小时:

σ \sigma σ 越小,模版的中间值越大,所占比重较大,被平滑的不那么厉害。

σ \sigma σ 越大,模版的中间值越小,所占权重变小,被平滑的厉害。

请添加图片描述

  • σ \sigma σ 固定时,模版大小改变:

请添加图片描述

当size为10时,模版有100个值,size为30时,模版有900个值,再归一化后,size小的模版权重相对更大些。

因此size较小时,被平滑的不那么厉害;size较大时,平滑的厉害。

  • 模版大小选取遵循原则:将滤波器半宽度设置为约 3 σ 3\sigma 3σ。滤波器大小为 3 σ + 3 σ + 1 3\sigma + 3\sigma + 1 3σ+3σ+1。例如 σ = 1 \sigma=1 σ=1 时,滤波器大小为3x3

高斯滤波器特点:

  • 从图像中去除“高频”成分(低通滤波器)

  • 高斯滤波与自身的卷积是另一个高斯滤波器。

    例如连续两个标准差为 σ \sigma σ 的高斯核进行卷积,等价于一个标准差为 2 σ \sqrt{2} \sigma 2 σ 高斯核进行卷积。遵循勾股定理。

    1.将原图进行参数为 σ \sigma σ 的高斯滤波: I ′ = I ∗ g σ I' = I * g_{\sigma} I=Igσ

    2.将上面结果进行参数为 σ \sigma σ 的高斯滤波: I ′ ′ = I ′ ∗ g σ I'' = I' * g_{\sigma} I′′=Igσ

    3.等价与直接将原图进行参数为 2 σ \sqrt{2} \sigma 2 σ 的高斯滤波: I ′ ′ = I ∗ g 2 σ I'' = I * g_{\sqrt{2} \sigma} I′′=Ig2 σ

  • 可分离核Separable Kernel:二维高斯函数可以被表示为两个一维高斯函数的乘积。

G σ ( x , y ) = 1 2 π σ 2 e − ( x 2 + y 2 ) 2 σ 2 = ( 1 2 π σ e − x 2 2 σ 2 ) ( 1 2 π σ e − y 2 2 σ 2 ) \begin{align} G_{\sigma}(x,y) &= \frac{1}{2 \pi \sigma^2} e^{- \frac{(x^2 + y^2)}{2 \sigma^2}} \\ &= (\frac{1}{2 \pi \sigma} e^{- \frac{x^2}{2 \sigma^2}})(\frac{1}{2 \pi \sigma} e^{- \frac{y^2}{2 \sigma^2}}) \\ \end{align} Gσ(x,y)=2πσ21e2σ2(x2+y2)=(2πσ1e2σ2x2)(2πσ1e2σ2y2)

可分离性的例子:Separability example

首先使用2D高斯滤波器对中心位置进行卷积:求得结果是65。

请添加图片描述

2D高斯滤波器可以分解为两个一维高斯滤波器的乘积:

请添加图片描述

使用分解的两个一维高斯滤波器原原图像依次卷积:行卷积核列卷积。最终得到结果仍然是65.

请添加图片描述

请添加图片描述

Separability分离性的用途:

n × n n \times n n×n 的图像,使用 m × m m \times m m×m 的核进行卷积的复杂度: O ( n 2 m 2 ) O(n^2 m^2) O(n2m2)

如果使用分离的卷积的复杂度: O ( n 2 m ) + O ( n m ) = O ( n 2 m ) O(n^2 m) + O(n m) = O(n^2 m) O(n2m)+O(nm)=O(n2m)

Noise噪声 分类

  • 椒盐噪声Salt and pepper noise:包含随机出现的黑色和白色像素。
  • 脉冲噪声Impulse noise:包含随机出现的白色像素。
  • 高斯噪声Gaussian noise:从高斯正态分布得出的强度变化

请添加图片描述

Gaussian noise高斯噪声

高斯噪声图 f ( x , y ) f(x,y) f(x,y) 的产生如下:
f ( x , y ) = f ˉ ( x , y ) + η ( x , y ) f(x, y) = \bar{f}(x, y) + \eta(x,y) f(x,y)=fˉ(x,y)+η(x,y)
其中 f ˉ ( x , y ) \bar{f}(x,y) fˉ(x,y) 为理想的图像, η ( x , y ) \eta(x,y) η(x,y) 为噪声处理,所有噪声iid于正态分布:
η ( x , y ) ∼ N ( μ , σ ) \eta(x,y) \sim \mathbf{N}(\mu, \sigma) η(x,y)N(μ,σ)
假设:独立,均值为0的噪声

请添加图片描述

  • 减少高斯噪声Reducing Gaussian noise:使用高斯滤波器

请添加图片描述

上图中第一行是 σ \sigma σ 取 0.05、0.1、0.2 产生的高斯噪声图。也就对应没有平滑的图。

第二行是使用 σ = 1 \sigma = 1 σ=1 的高斯滤波结果,此时高斯核大小为 7 × 7 7 \times 7 7×7

第三行是使用 σ = 2 \sigma = 2 σ=2 的高斯滤波结果,此时高斯核大小为 13 × 13 13 \times 13 13×13

结论:使用较大标准差的平滑可以抑制噪声, 但也会使图像模糊。

Reducing salt-and-pepper noise:Median filtering中值滤波

中值滤波器通过选择窗口中的中值强度对窗口进行操作。

请添加图片描述

中值滤波是非线性滤波。对异常值具有稳健性的优点:Robustness to outliers

请添加图片描述

下面是有椒盐噪声的图和均值滤波后的图:

请添加图片描述

Sharpening revisited:再看锐化

请添加图片描述

拉普拉斯高斯:

请添加图片描述

Edge detection | Origin of edges

  • 边缘检测目标:识别图像中的突变(不连续)。直观地说,大多数来自图像的语义和形状信息都可以编码在边缘中。

各种边的起源(种类):边缘是由多种因素造成的

请添加图片描述

  • surface normal discontinuity表面法向不连续:也就是面上的不连续,两个面的交界处产生的边。
  • depth discontinuity间断面深度:深度上的边缘,上面瓶子因为是圆形的,本身没有边,但图像只能显示其中的一部分,由于深度上的不连续形成的边。
  • surface color discontinuity表面颜色不连续:文字。
  • illumination discontinuity照明不连续:阴影产生的边。

Characterzing edges描述边缘

边缘是图像强度函数中快速变化的地方:一阶导的极值点。

请添加图片描述

对于2D函数 f ( x , y ) f(x,y) f(x,y) 的偏导数定义:
∂ f ( x , y ) ∂ x = lim ⁡ ϵ → 0 f ( x + ϵ , y ) − f ( x , y ) ϵ \frac{\partial f(x,y)}{\partial x} = \lim_{\epsilon \to 0} \frac{f(x + \epsilon,y) - f(x,y)}{\epsilon} xf(x,y)=ϵ0limϵf(x+ϵ,y)f(x,y)
对于离散数据,我们可以使用有限差分进行近似:
∂ f ( x , y ) ∂ x ≈ f ( x + 1 , y ) − f ( x , y ) 1 \frac{\partial f(x,y)}{\partial x} \approx \frac{f(x + 1,y) - f(x,y)}{1} xf(x,y)1f(x+1,y)f(x,y)
为了实现上面的卷积,相关的过滤器如何设计?

请添加图片描述

左图的滤波器: [ − 1 , 1 ] [-1,1] [1,1] 。水平方向卷积,求得垂直方向边缘。

右图的滤波器: [ − 1 , 1 ] T [-1,1]^T [1,1]T [ 1 , − 1 ] T [1,-1]^T [1,1]T 。垂直方向卷积,求得水平方向边缘。

Image gradient图像梯度

图像的梯度是由偏导数组成的向量:
∇ f = [ ∂ f ∂ x , ∂ f ∂ y ] \nabla f = [\frac{\partial f}{\partial x}, \frac{\partial f}{\partial y}] f=[xf,yf]

  • 梯度方向指向信号变化最大的方向,也就是指向图像强度增加最快的方向。
  • 梯度方向与边缘垂直。

请添加图片描述

梯度方向定义:
θ = t a n − 1 ( ∂ f ∂ y / ∂ f ∂ x ) \theta = tan^{-1} (\frac{\partial f}{\partial y} / \frac{\partial f}{\partial x}) θ=tan1(yf/xf)
边缘强度由梯度幅度给出:The edge strength is given by the gradient magnitude
∣ ∣ ∇ f ∣ ∣ = ( ∂ f ∂ x ) 2 + ( ∂ f ∂ y ) 2 || \nabla f || = \sqrt{(\frac{\partial f}{\partial x})^2 + (\frac{\partial f}{\partial y})^2} ∣∣∇f∣∣=(xf)2+(yf)2

  • 使用梯度幅值来描述是否是边的可能性,幅值越大,偏导数越大,偏导数越有可能是极值点,则该点越有可能是边。这也叫做边缘强度。

请添加图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/499712.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java图书管理系统---命令行

项目列表 Book包 Book类内包含book的基本属性 BookList类初始化图书列表并且提供图书的属性方法 User包 Administrator类 common类 operator包 功能接口 新增图书功能 借阅图书功能 删除图书功能 显示图书功能 查找图书功能 归还图书功能 结束释放资源功能 运行…

matlab实现不同窗滤波器示例

1 汉明窗低通滤波器 : 在Matlab中使用汉明窗设计低通滤波器可以通过fir1函数实现。汉明窗通常用于设计滤波器,可以提供更突出的频率特性。 下面是一个示例代码,演示如何在Matlab中使用汉明窗设计低通滤波器: % 定义滤波器参数 fs …

DOM 获取父子节点

DOM 是以树状结构排列的,所以父子关系是相对的,当li为我们的目标节点的时候,ul为其父节点,其他li为它的兄弟节点,li里面包含的标签为子节点,以此类推。 那我们如何找父节点? 元素.parentNode&am…

ROS2----运行helloworld、集成开发环境的搭建

前言:ROS2已经出来了,ROS1会被逐渐淘汰,大家尽量不要学ROS1了!! 文章目录 一、运行helloworld1.创建工作空间2.创建功能包3.源文件和配置文件4.编译与运行5.源码编写下的编译与运行6.运行优化 二、集成开发环境的搭建…

Javaweb之SpringBootWeb案例之 SpringBoot原理的详细解析

3. SpringBoot原理 SpringBoot使我们能够集中精力地去关注业务功能的开发,而不用过多地关注框架本身的配置使用。而我们前面所讲解的都是面向应用层面的技术,接下来我们开始学习SpringBoot的原理,这部分内容偏向于底层的原理分析。 在剖析Sp…

嵌入式中14 个超级牛的免费开源小工具

Homebrew for macOS 地址:https://brew.sh Mac 上非常好用的包管理工具,很多常见的安装都可以通过 brew install app 或者 brew cask install app 直接安装,类似 apt-get 。 Oh My Zsh 地址:https://github.com/robbyrussell…

基于springboot实现线上阅读系统项目【项目源码+论文说明】计算机毕业设计

基于springboot实现线上阅读系统演示 摘要 随着社会发展速度的愈来愈快,以及社会压力变化的越来越快速,致使很多人采取各种不同的方法进行解压。大多数人的稀释压力的方法,是捧一本书籍,心情地让自己沉浸在情节里面,以…

【2022 J1】乘方

本主又双叒叕来更新了,一圈三连不用说了吧😁 本题是J组第二轮的题: 题目描述 小文同学刚刚接触了信息学竞赛,有一天她遇到了这样一个题:给定正整数 a 和 b,求 ��ab 的值是多少。 …

【iOS ARKit】协作 Session 实例

协作 Session 使用注意事项 协作 Session 是在 ARWorldMap 基础上发展起来的技术,ARWorldMap 包含了一系列的地标、ARAnchor 及在观察这些地标和 ARAnchor 时摄像机的视场(View)。如果用户在某一个位置新创建了一个 ARAnchor,这时…

DataGrip2023配置连接Mssqlserver、Mysql、Oracle若干问题解决方案

1、Mssqlserver连接 本人连的是Sql2008,默认添加时,地址、端口、实例、账号、密码后,测试连接出现错误。 Use SSL:不要勾选 VM option:填写,"-Djdk.tls.disabledAlgorithmsSSLv3, RC4, DES, MD5withR…

人工智能如何改变我们与世界的沟通的方式?

腾讯研究院 作为一名设计师、艺术家、科技研究人员,人工智能如何改变我们与世界的沟通的方式? 1.《音外话》 它是一款语音至视频生成人工智能的系统,它把我们的话语转化为充满情感的视觉影像。这个系统不仅可以捕捉语言的字面意义,还能理解…

小红书关键词爬虫

标题 1 统计要收集的关键词,制作一个文件夹2 爬取每一页的内容3 爬取标题和内容4 如果内容可以被查看,爬取评论内容5 将结果进行汇总,并且每个帖子保存为一个json文件,具体内容6 总结 1 统计要收集的关键词,制作一个文…

ts的重载

官网示例 TypeScript: Documentation - Template Literal Types 这里大概理解是 T 继承了Number|sting 加上&#xff1f;条件判断就是 T继承Number|sting 部分为true 没有继承部分为false&#xff0c; 就是输入string, 为true, 输入 null 则为false, type Exclude<T, U&…

八股文打卡day24——数据库(1)

面试题&#xff1a;左连接和右连接的区别&#xff1f; 我的回答&#xff1a; 左连接的SQL语句是&#xff1a;左表 left join 右表 on 连接条件&#xff0c;表示以左表为基础&#xff0c;将左表的的所有记录与右表进行连接。即使右表中没有与左表匹配的记录&#xff0c;左连接…

类和对象(2)——距离C++又近了一步

目录 一、构造函数 1.1声明和定义构造函数 1.2成员名和参数名 1.3构造函数的使用 1.4初始化列表 二、析构函数 2.1析构函数的概念 2.2析构函数的性质 三、拷贝构造函数 四、赋值运算符重载 4.1运算符重载 4.2赋值运算符重载 一、构造函数 我们知道&#xff0c;C中…

网络编程作业day2

1.将TPC和UDP通信模型各敲两遍 &#xff08;1&#xff09;TPC通信模型&#xff1a; 服务器代码&#xff1a; #include <myhead.h> #define SERVER_IP "192.168.125.136" #define SERVER_PORT 1314 int main(int argc, const char *argv[]) {//1、创建用于监…

Rocky Linux 运维工具 ls

一、ls 的简介 ​​ls​ 用于列出当前目录下的文件和目录&#xff0c;以及它们的属性信息。通过 ​ls​命令可以查看文件名、文件大小、创建时间等信息&#xff0c;并方便用户浏览和管理文件。 二、ls 的参数说明 序号参数描述1-a显示所有文件&#xff0c;包括以 ​.​开头的…

neo4j创建新数据库

根据网上提供的教程&#xff0c;neo4j并没有提供创建数据库的命令&#xff0c;其只有一个默认数据库graph.db&#xff0c;该数据库中的所有数据将存储在neo4j安装路径下的data/databases/graph.db目录中。 因此&#xff0c;我们猜想&#xff0c;如果我们将默认数据库的名字修改…

YOLOv8改进 | 独家创新篇 | 结合SOTA思想利用双主干网络改进YOLOv8(全网独家创新,最重磅的更新)

一、本文介绍 本文给大家带来的改进机制是结合目前SOTAYOLOv9的思想利用双主干网络来改进YOLOv8(本专栏目前发布以来改进最大的内容,同时本文内容为我个人一手整理全网独家首发 | 就连V9官方不支持的模型宽度和深度修改我都均已提供,本文内容支持YOLOv8全系列模型从n到x均可…

ardupilot 及PX4姿态误差计算算法对比分析

目录 文章目录 目录摘要1.APM姿态误差计算算法2.PX4姿态误差计算算法3.结论摘要 本节主要记录ardupilot 及PX4姿态误差计算算法差异对比过程,欢迎批评指正。 备注: 1.创作不易,有问题急时反馈 2.需要理解四元物理含义、叉乘及点乘含义、方向余弦矩阵含义、四元数乘法物理含…