超分辨率技术

何为超分辨率?

超分辨率技术(Super Resolution):通过硬件或软件的方法提高图像或视频帧的分辨率, 通过一系列低分辨率图像获取到高分辨率图像的过程。
功能介绍:提升图像或视频分辨率最高至8K,能够生成逼真、自然的细节纹理,提升视觉效果,同时可以保证生成纹理的连惯性,不易抖动。
适用场景:旧照片、电影、电视剧、纪录片、动漫、综艺和手机短视频等。

超分辨率理论描述

超分辨率的理论描述又是什么样子的呢?如下图示,最直观地讲,超分辨率就是将左图中像素点之间的空间位置用像素点进行填充,使得整个图像具有更多的像素点,更丰富的细节,从信号的角度讲就是补充出更多的高频成分。
在这里插入图片描述

目前超分辨率技术主要可以分为两类,单图像超分辨率(Single Image Super Resolution,简称SISR)和视频超分辨率(Video Super Resolution,简称VSR)。上述两类技术中,一般来讲后者相比于前者具有更多可参考信息,且有更好的高分辨率视频图像的重建质量,但是其更高的计算复杂度也限制了其应用。本文将以单图超分辨率/图像插值为例,进行超分辨率技术的介绍。

在这里插入图片描述
上图中,左图:原始图像,右图:经过AI技术修复后的高分辨率图像

视频图像超分辨率的方法

视频图像超分辨率的方法通常分为2种:传统图像插值方法和基于深度学习的方法。基于图像插值算法:指通过在图像原有的像素周围插入新像素来加大图像的尺寸,插入像素后还要给这些像素赋值,从而恢复图像内容,达到提高图像分辨率的效果,主要包括图示中的方法。
在这里插入图片描述线性插值(传统的图像插值)

最近邻插值:实现起来运算量最小,只需要直接使用离它最近的原有像素点的值,作为新像素点的值即可。但是这样没有考虑周围像素点的影响,采样后有明显的不连续性,会出现锯齿和马赛克块效应。

在这里插入图片描述
左图为松鼠原图,右图为像素等比例扩大1.5倍后,可以看左图进行最近邻插值后,出现很多锯齿和马赛克。

双线性插值:使用相邻2x2区域的像素值,根据与新像素的距离加权求和。过程稍微复杂些,克服了不连续性,但是未考虑相邻像素的相互影响,边缘会变模糊,还会有轻微马赛克块效应。
双三次插值:和双线性插值类似,但它分别使用4x4和8x8区域的像素进行插值,算法更复杂,克服了像素不连续性、考虑相邻像素的影响,输出的图像边缘比双线性插值更为平滑和精准。
总的来说,线性插值方法是在图像插值过程中采用同一种插值内核,不考虑待插像素点所处的位置,这种做法会使图像中的边缘变得模糊不清,达不到高清图像的视觉效果。
(Tip:图像中平坦纯色的区域叫做低频区域,图像中凹凸不平有纹理的地方叫做高频区域。边缘是高频区域和低频区域的分界。)
在这里插入图片描述
非线性插值方法

非线性插值方法相对上述方法,运算更复杂,但是图像边缘保护得更好:
基于边缘信息的插值算法:对非边缘像素点采用无方向的线性插值方法进行插值,而对于边缘像素点则采用有方向的插值方法,保护了边缘,让边缘更光滑。
基于小波系数的插值算法:将图像的高、低频信息分离,单独对高频信息进行处理。若能准确地得到图像的高频细节,利用重构理论,将得到的高频与原有的低频相叠加,再通过离散小波逆变换就得到一幅高分辨率的图像。
基于深度学习的插值算法:将低分辨率图像恢复出清晰的纹理,效果比之前的传统算法更好,特别是当上采率比较高的时候,传统算法不能很好地重构出对应的高清图像,基于深度学习的算法就可获得更好的图像效果,优势明显。
在这里插入图片描述
如上所示,线性插值和非线性插值效果的对比,基于边缘信息的算法边缘锯齿明显减少,一般来说,我们所说的超分辨率都默认指基于深度学习的插值算法,下面简单介绍基于深度学习得插值算法。
基于深度学习的超分:利用高分辨率图像的先验知识和以混叠形式存在的高频信息进行复原,在视频中还利用相邻图像之间的互补信息。超分利用深度神经网络通过训练,提前学习到了这些知识,训练好的深度神经网络就是超分模型。

在这里插入图片描述如上图,将真实的低分辨率图像输入到训练好的超分模型中利用模型习得的先验知识,重建图像的高频细节,从而获得较好的图像恢复效果。

基于深度学习的算法步骤包括:
1、开始训练的时候用随机数初始化模型的权重。
2、将训练数据里面的低清图像输入到模型里面,正向计算得到输出重建的高清图像。
3、比较生成的重建高清图像和真实高清图像之间的差异,用损失函数衡量。
4、利用梯度下降法最小化损失函数,目的是使重建高清图像和真实高清图像尽量接近,利用梯度反向传播法更新模型的权重。
Tips:损失函数是评价模型的预测值和真实值不一样的程度。包括:像素损失(Pixel-wise Loss),内容损失(Perceptual Loss),纹理损失(Texture Loss),对抗损失(GAN Loss)。超分最常见的是像素损失,将多种损失函数相结合的方式可以获得更强大的超分模型。
在这里插入图片描述
大量数据学习,模型权重反复优化获取超分模型示意图

参考:https://www.imperial-vision.com/34/303

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/701303.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C#窗体程序设计笔记:如何调出控件工具箱,并设置控件的属性

文章目录 调出控件工具箱设置控件属性 调出控件工具箱 使用Visual Studio打开C#解决方案后,初始界面如下图所示: 接着,在上方的菜单栏依次选择“视图”“工具箱”,即可打开工具箱,如下图所示: 设置控件属…

前端CSS3基础1(新增长度单位,盒子模型,背景,边框,文本属性,渐变,字体,2D变换,3D变换)

前端CSS3基础1(新增长度单位,盒子模型,背景,边框,文本属性,渐变,字体,2D变换,3D变换) CSS3 新增长度单位CSS3 新增盒子模型相关属性box-sizing怪异盒模型box-…

【VMware】vSphere 8.0 安装和设置简介

本信息的目标读者为熟悉虚拟机技术和数据中心操作并具有丰富经验的 Windows 或 Linux 系统管理员。 vSphere 8.0 提供了各种安装和设置选项,这些选项定义了相应的任务序列。 vSphere 的两个核心组件是 ESXi 和 vCenter Server。ESXi 是可用于创建和运行虚拟机和虚拟…

如何去掉试卷答案,并打印出来

实际上,针对试卷答案的问题,一个简单而高效的方法是使用图片编辑软件中的“消除笔”功能。只需将试卷拍摄成照片,然后通过这一功能,就可以轻松擦除答案。虽然这种方法可能需要一些时间和耐心,但它确实为我们提供了一个…

vue布局设置——使用 el-drawer 打造个性化 Admin 后台布局设置

在前端开发中,我们常常需要为 admin 后台构建灵活且个性化的布局设置。今天,我要分享的是如何利用 el-drawer 来实现这样一个有趣的功能。 首先,我们来看一下主要的设置参数: 1. theme: 用于定义主题,可以根据需求切换…

文心一言 VS 讯飞星火 VS chatgpt (259)-- 算法导论19.3 2题

二、使用聚合分析来证明 FIB-HEAP-DECREASE-KEY 的 O(1) 摊还时间是每一个操作的平均代价。如果要写代码,请用go语言。 文心一言: FIB-HEAP-DECREASE-KEY 是斐波那契堆(Fibonacci Heap)操作中的一个,它允许我们减少堆…

vue3专栏项目 -- 五、权限管理(上)

一、登录部分 1、第一部分:获取token 前面我们主要是在获取数据上下功夫,到目前为止我们已经能获取首页和详情页的数据了,现在我们将数据转移到权限管理上来,也就是说我们要处理用户登录、注册等一系列的行为,在这部…

R语言:ROC分析

> install.packages("pROC") > library(pROC) > inputFile"结果.txt" > rtread.table(inputFile, headerT, sep"\t", check.namesF, row.names1) > head(rt) con treat TCGA-E2-A1L7-11A-con…

生产环境磁盘变更方案

datanode磁盘扩容(1人天) 扩容磁盘 1.1 扩容前检查、新盘初始化 确定block副本统计正常,无丢块,无under-replicated 块 后台执行命令检查 hdfs dfs fsck / 无异常可进行以下步骤进行磁盘扩容 新盘初始化 ##格式化新盘,命令示例: mkfs.xfs /dev/sdc##挂载新盘,命令示…

[数据集][图像分类]抽烟打电话分类数据集6150张3类别

数据集类型:图像分类用,不可用于目标检测无标注文件 数据集格式:仅仅包含jpg图片,每个类别文件夹下面存放着对应图片 图片数量(jpg文件个数):6150 分类类别数:3 类别名称:["normal","phone&…

基于大模型训练的数字识别

创作原因 现在写电赛题,题目有识别数字的要求。但使用设备openmv使用模板匹配的算法帧率很低,且识别效果不是很好,于是我们就想到了利用神经网络训练模型来识别数字 正文部分 内容介绍 本文内容是基于openmv使用Edge Impulse训练大模型。…

为什么cca门限和tx 功率有关系

Cca是用来决定信道是否繁忙,好像只和收有关。 但是为什么和tx有关。 设想一下这个网路布局。 如果某个STA在决定是否发送的时候,是否不能只看收到的干扰多大,还应该“冒险”一下,如果自己的功率足够,那么就可以扛住干…