OpenCV学习笔记(6)_由例程学习高斯图像金字塔和拉普拉斯金字塔

在这里插入图片描述

1 图像金字塔

图像金字塔是图像多尺度表达的一种。

尺度,顾名思义,可以理解为图像的尺寸和分辨率。处理图像时,经常对源图像的尺寸进行缩放变换,进而变换为适合我们后续处理的大小的目标图像。这个对尺寸进行放大缩小的变换过程,称之为尺度调整。

图像金字塔则是图像多尺度调整表达的一种重要的方式,图像金字塔方法的原理是:将参加整合的每幅图像分解为拥有多个尺度的金字塔图像序列,越低分辨率的图像,位于金字塔的越上层,反之,越高分辨率的图像,则位于金字塔的越下层。金字塔的层数,则由下而上分别为0, 1, 2, …, N.

每一层的图像的大小都为上一层的1/4。

把这些不同尺度的金字塔图像按照上述规则组合起来,则得到一个形如金字塔的结构,即称为图像金字塔。

在这里插入图片描述

图像金字塔最初用于机器视觉和图像压缩,主要用于图像的分割和融合。

2 高斯金字塔和拉普拉斯金字塔

有两种类型的金字塔经常出现在文献和应用当中,它们分别是:

  • 高斯金字塔(Gaussian Pyramid):主要是用来向下采样(缩小);
  • 拉普拉斯金字塔(Laplacian Pyramid):用来从金字塔低层图像重建上层未采样的图像,可以对图像进行最大程度的还原,配合高斯金字塔一起使用。

2.1 高斯金字塔

在图像向下取样中,一般分两步:
(1) 对图像 G i G_i Gi进行高斯卷积核(高斯滤波);
(2) 删除所有的偶数行和列。

在第一步中,使用的高斯卷积核为:
1 16 [ 1 4 6 4 1 4 16 24 16 4 6 24 36 24 6 4 16 24 16 4 1 4 6 4 1 ] \frac{1}{16}\left[ \begin{array}{c} 1 & 4 & 6 & 4 & 1 \\ 4 & 16 & 24 & 16 & 4 \\ 6 & 24 & 36 & 24 & 6 \\ 4 & 16 & 24 & 16 & 4 \\ 1 & 4 & 6 & 4 & 1 \end{array}\right] 161 1464141624164624362464162416414641
卷积完成后,将偶数行和偶数列抽走删除,即得到下一层图像。

若是向上取样,一般也分两步:
(1) 对图像 G i + 1 G_{i+1} Gi+1 增加偶数行和偶数列,都用0填充;
(2) 对图像进行高斯卷积,插值时滤波器乘以系数4。

2.2 拉普拉斯金字塔

在高斯金字塔下采样的过程中,可以看出图像信息出现了损失。这意味着如果下采样之后再上采样,图像并不能还原。图像将丢失掉部分高频信息。

此时如果想要保留图像的高频信息,则需要引入拉普拉斯金字塔:
L i = G i − P y r U p ( P y r D o w n ( G i ) ) L_i = G_i - PyrUp(PyrDown(G_i)) Li=GiPyrUp(PyrDown(Gi))
即第i层的拉普拉斯金字塔图像,先计算高斯金字塔下采样再上采样的图像 P y r U p ( P y r D o w n ( G i ) ) PyrUp(PyrDown(G_i)) PyrUp(PyrDown(Gi)),然后用第i层的原图 G i G_i Gi减去它。

3 OpenCV中的图像金字塔例程

3.1 pyrUp和pyrDown函数

OpenCV中的pyrUp函数原型为:

void cv::pyrUp(InputArray src,OutputArray dst,const Size & dstsize = Size(),int borderType = BORDER_DEFAULT)

pyrDown函数原型为:

void cv::pyrDown(InputArray src,OutputArray dst,const Size & dstSize = Size(),int borderType = BORDER_DEFAULT)

其中,src为原始图像,dst为上采样/下采样的目标图像, dstSize为目标图像的尺寸, borderType为边界类型,这里默认为BORDER_DEFAULT.

3.2 Pyramids.cpp例程

原理部分讲述结束,下面进入OpenCV的例程:

OpenCV的Sample文件夹下有关于图像金字塔的例程:
samples/cpp/tutorial_code/ImgProc/Pyramids/Pyramids.cpp

#include "iostream"
#include "opencv2/imgproc.hpp"
#include "opencv2/imgcodecs.hpp"
#include "opencv2/highgui.hpp"
using namespace std;
using namespace cv;
const char* window_name = "Pyramids Demo";
int main(int argc, char** argv)
{cout << "\n Zoom In-Out demo \n ""------------------  \n"" * [i] -> Zoom in   \n"" * [o] -> Zoom out  \n"" * [ESC] -> Close program \n" << endl;const char* filename = argc >= 2 ? argv[1] : "../data/chicky_512.png";// Loads an imageMat src = imread(samples::findFile(filename));// Check if image is loaded fineif (src.empty()) {printf(" Error opening image\n");printf(" Program Arguments: [image_name -- default chicky_512.png] \n");return EXIT_FAILURE;}for (;;){imshow(window_name, src);char c = (char)waitKey(0);if (c == 27){break;}else if (c == 'i'){pyrUp(src, src, Size(src.cols * 2, src.rows * 2));printf("** Zoom In: Image x 2 \n");}else if (c == 'o'){pyrDown(src, src, Size(src.cols / 2, src.rows / 2));printf("** Zoom Out: Image / 2 \n");}}return EXIT_SUCCESS;
}

注意以上源码是被小白修改了的,因为小白的工程里面用于放缩的图片的位置是在data文件夹下

const char* filename = argc >= 2 ? argv[1] : "../data/chicky_512.png";

这个程序打开后会显示一幅小狗的图像,并一直等待键盘输入。
在这里插入图片描述

如果你输入一个"i",则图像将被放大,即Zoom In;
如果你输入一个"o",则图像将被缩小,即Zoom Out;
直到你输入一个"ESC",程序退出。

但是这个程序只使用了高斯金字塔,反复测试几次你就会发现:如果先缩小了很多倍,再重新放大,那么由于下采样时总是在丢失图像信息,多操作几次之后,小狗的面目就变得非常模糊。
下图就是缩小了3次之后再放大到原始尺寸时所看到的小狗:
在这里插入图片描述

那么有没有办法把这个例程改造成可以带有拉普拉斯金字塔,可以在放缩后仍然还原原始分辨率细节的小狗图呢?当然有。

3.3 改造后的图像金字塔例程

使用STL中的stack来保存拉普拉斯金字塔图像,则可以简单地实现分辨率还原的功能:

#include "iostream"
#include "opencv2/imgproc.hpp"
#include "opencv2/imgcodecs.hpp"
#include "opencv2/highgui.hpp"
#include <stack>
using namespace std;
using namespace cv;
const char* window_name = "Pyramids Demo";
int main(int argc, char** argv)
{cout << "\n Zoom In-Out demo \n ""------------------  \n"" * [i] -> Zoom in   \n"" * [o] -> Zoom out  \n"" * [ESC] -> Close program \n" << endl;const char* filename = argc >= 2 ? argv[1] : "../data/chicky_512.png";// 加载一幅图像Mat src = imread(samples::findFile(filename));int picMaxWidth = src.cols;int picMaxHeight = src.rows;// 检查是否加载成功if (src.empty()) {printf(" Error opening image\n");printf(" Program Arguments: [image_name -- default chicky_512.png] \n");return EXIT_FAILURE;}// 用于存储拉普拉斯金字塔的栈结构stack<Mat> stackMat;for (;;){imshow(window_name, src);char c = (char)waitKey(0);if (c == 27)												// ESC Key 则退出{break;}// 放大图像但不允许超过原图大小else if (c == 'i'){if (src.cols >= picMaxWidth){printf("** cannot Zoom In: Image reaches max size!\n");continue;}pyrUp(src, src, Size(src.cols * 2, src.rows * 2));if (!stackMat.empty()){Mat temp;temp = stackMat.top();src.convertTo(src, CV_16SC3);						// 对图像格式进行转换,目的是进行负差值的正确计算src += temp;										// 取栈顶的拉普拉斯金字塔图像进行原图还原src.convertTo(src, CV_8UC3);						// 将图像还原成8位3通道,便于显示stackMat.pop();}printf("** Zoom In: Image x 2 \n");}// 缩小图像else if (c == 'o'){Mat temp1, temp2;src.copyTo(temp1);pyrDown(src, src, Size(src.cols / 2, src.rows / 2));pyrUp(src, temp2, Size(src.cols * 2, src.rows * 2));// 对图像进行格式转换, 目的是得到差值图像的正确负值temp1.convertTo(temp1, CV_16SC3);temp2.convertTo(temp2, CV_16SC3);temp1 -= temp2;											// 计算拉普拉斯金字塔差值图像stackMat.push(temp1);									// 将拉普拉斯金字塔压进栈中printf("** Zoom Out: Image / 2 \n");}}return EXIT_SUCCESS;
}

这段代码中:

  • 通过一个stackMat来记录缩小时造成的图像信息损失;
  • 通过压栈和出栈的方式保证每一层下采样时的拉普拉斯金字塔都能得以保存;
  • 通过图像类型反复转换来保证在计算差值时能够正确地保留像素差的负值;
  • 通过限制放大的倍率,防止在放大到超过原始图像分辨率,再重新下采样时造成不可逆的图像信息损失。

细节其实挺多,针对第三点和第四点简单铺开讲一下:

  • 如果不进行图像类型的转换(大家可以试试把那几句图像类型转换的代码注释掉),那么在计算拉普拉斯金字塔时,图像差值将无法保留负值,这将会导致在反复缩放过程中,图像的部分信息发生丢失,小狗图中的高频细节会越来越亮,像下图中一样;
    在这里插入图片描述

  • 如果不限制图像的放缩倍率,那么当图像先放大到原始图像尺寸的2倍,再重新缩小到原始尺寸时,图像先经历了一次上采样,放大时的插值部分属于无中生有,再重新下采样时,就引入了信息失真,因此对原例程进行了修改,使其无法将图像放大到超过原始尺寸,这样就保证了在图像回到原始尺寸大小时,其图像细节能与原始图像保持一致。下图是如果不限制放大倍率,在放大超过原始尺寸后再重新回到原始尺寸时,图像的效果:(如果你将它和原始图像比较一下,会发现有细微的差别)
    在这里插入图片描述

至此,小白和大家一起学习了这个例程,并对高斯图像金字塔和拉普拉斯图像金字塔有了更深层次的理解。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/107351.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【C++从0到王者】第二十九站:二叉搜索树常见题

文章目录 一、根据二叉树创建字符串二、二叉树的最近公共祖先1.解法一&#xff1a;递归2.解法二&#xff1a;借助栈来寻找路径 三、二叉搜索树与双向链表四、前序与中序构建二叉树五、中序与后序构建二叉树 一、根据二叉树创建字符串 题目链接&#xff1a;力扣第606题&#xff…

Trinitycore学习之在Linux环境上搭建服务器并测试运行

1&#xff1a;准备环境&#xff0c;这里用ubuntu 22.04进行测试&#xff0c;安装环境后为了方便&#xff0c;换源。 注意&#xff1a;这里用的虚拟机&#xff0c;在虚拟机上生成地图信息&#xff0c;地图信息占用内存比较大&#xff0c;我暂时设置磁盘50G进行测试&#xff0c;…

Git学习记录

Contest 一、工作区域二、操作命令2.1 创建仓库2.2 查看仓库状态2.3 从工作区向暂存区添加文件2.3.1 只添加一个文件2.3.2 添加全部文件 2.4 从暂存区向仓库区添加文件2.5 查询日志2.5.1 从当前版本开始查询2.5.2 查看所有日志 2.6 回滚2.6.1 从仓库回滚到工作区2.6.2 取消工作…

c++的this指针

目录 this指针的工作原理 this指针的应用 const修饰的成员函数 this指针的工作原理 在c中同一个类的不同对象&#xff0c;在内存中有不同的储存空间&#xff0c;但是成员函数在内存中只保存了一份&#xff0c;在调用函数处理成员数据时&#xff0c;this指针能保证该成员函数…

2023大数据面试总结

文章目录 Flink&#xff08;SQL相关后面专题补充&#xff09;1. 把状态后端从FileSystem改为RocksDB后&#xff0c;Flink任务状态存储会发生哪些变化&#xff1f;2. Flink SQL API State TTL 的过期机制是 onCreateAndUpdate 还是 onReadAndWrite&#xff1f;3. watermark 到底…

《Graph of Thoughts: Solving Elaborate Problems with Large Language Models》中文翻译

《Graph of Thoughts: Solving Elaborate Problems with Large Language Models》- 思维图&#xff1a;用大型语言模型解决复杂的问题 论文信息摘要1. 介绍2. 背景及符号2.1 语言模型和情境学习 3. GoT 框架3.1 推理过程3.2 思想转变3.3 评分和排名思路 4. 系统架构及扩展性4.1…

驱动开发--自动创建节点udev机制的实现过程分析

一&#xff0c;创建设备文件的机制 1&#xff0c;mknod&#xff1a;手动创建设备节点 2&#xff0c;devfs&#xff1a;创建设备节点的逻辑在内核空间&#xff0c;2.5版本后淘汰 3&#xff0c;udev&#xff1a;自动创建设备节点的机制&#xff0c;逻辑在用户空间&#xff0c;…

vue2中使用富文本编辑器tinyMCE全过程

第一步&#xff1a;安装TinyMCE $npm install tinymce5.10.0 -S $npm install tinymce/tinymce-vue3.0.1 -S 第二步&#xff1a;在node_modules中找到tinymce文件夹将内部文件移入pubilc/tinymce文件夹中在index.html文件中引入tinymce.min.js 注意&#xff1a;不把js文件放…

数据结构和算法(5):二叉树

树 向量允许通过下标或秩&#xff0c;在常数的时间内找到目标对象&#xff1b;然而&#xff0c;一旦需要对这类结构进行修改&#xff0c;那么无论是插入还是删除&#xff0c;都需要耗费线性的时间。 列表允许借助引用或位置对象&#xff0c;在常数的时间内插入或删除元素&…

linux 系统资源命令

系统资源命令 当前系统负载 w查看的是整体的负载&#xff0c;可以来观察当前系统有没有压力 w 系统当前负载 第一行显示的内容依次为&#xff1a;时间、系统运行时间、登录用户数、平均负载(1分钟、5分钟、15分钟) 第二行后展示的信息为&#xff1a;当前登录的都有哪些用户、在…

Falcon 180B 目前最强大的开源模型

Technology Innovation Institute最近发布了Falcon 180B大型语言模型(LLM)&#xff0c;它击败了Llama-2 70b&#xff0c;与谷歌Bard的基础模型PaLM-2 Large不相上下。 180B是是Falcon 40B模型一个最新版本。以下是该模型的快速概述: 180B参数模型&#xff0c;两个版本(base和…

【Java基础篇 | 类和对象】--- 聊聊什么是内部类

个人主页&#xff1a;兜里有颗棉花糖 欢迎 点赞&#x1f44d; 收藏✨ 留言✉ 加关注&#x1f493;本文由 兜里有颗棉花糖 原创 收录于专栏【JavaSE_primary】 本专栏旨在分享学习Java的一点学习心得&#xff0c;欢迎大家在评论区讨论&#x1f48c; 前言 当一个事物的内部&…