任意尺度图像超分辨率的基准技术分析

任意尺度图像超分辨率的基准技术分析

在计算机视觉领域,超分辨率(SR)一直是一个突出的研究领域。它的目的是从低分辨率(LR)图像重建高分辨率(HR)图像。最近,主要基于学习图像的连续表示的任意尺度图像SR取得了重大进展。

这些方法通常需要在特定范围内(即×1.0-×4.0)使用连续的细粒度尺度变化LR-HR图像对进行训练。

然而,当将任意比例的图像SR方法应用于实际应用时,仍然存在问题。

如图5-5所示,一个问题是,大多数当前的方法都是在几个广泛使用的SR数据集上训练和评估的,包括DIV2K、Urban100、Manga109、Set5、Set14和BSD300。通常,这些数据集应用简单的合成退化模型(例如双三次下采样)来获得不同分辨率的数据。

然而,尽管在模拟数据上获得了令人满意的结果,但现实世界中的图像退化更为复杂,导致现实世界图像的视觉效果不佳。另一个问题是,最近提出了几个真实世界的图像SR数据集,包括RealSR、City100、SR-RAW和DRealSR[30]。然而,这些数据集是有限的,因为它们只捕获固定放大倍数(例如,×2、×3、×4)的图像对,缺乏图像的连续表示。

鉴于这一系列问题,总结为复杂的现实世界任意尺度图像SR问题。当前的方法无法学习现实世界图像的连续表示,导致SR结果缺乏视觉自然性。如图5-5所示,为了解决这个问题并提高当前任意尺度图像SR方法的性能,使质量可以像光学变焦一样,引入了一个新的数据集——连续光学变焦数据集(COZ),作为任意尺度图像SL的第一个实际数据集。设计并开发了一个连续光学变焦成像系统,其中光学透镜被无线控制,在特定焦距内增量均匀旋转。捕获同一场景从低到高放大倍数的多对连续图像。使用基于SIFT匹配点的两阶段图像对对齐算法,获得了精确对齐的真实LR-HR图像对。该数据集提供了各种放大比例下丰富的真实世界图像对,用于训练任意比例的SR模型,从而能够学习真实世界场景中的连续图像退化。

比较实验结果表明,当应用于真实图像时,在真实图像数据上训练的模型优于在模拟数据上训练。为了增强模型对真实世界复杂图像退化的鲁棒性,提出了一种基于MLP混合器架构和元学习的任意尺度图像SR方法,称为局部混合隐式网络(LMI)。在现实世界中,纹理信息在空间中表现为多个坐标及其相应的RGB值。新方法利用元学习同时学习多个局部坐标信息并生成混合权重,这些权重应用于与不同坐标相关的特征,以进行有效的混合。这与以前一次只考虑一个坐标及其特征信息的方法有着根本的不同,这种方法容易受到复杂退化的干扰。实验结果表明,新方法在学习真实图像的连续表示方面是有效的,并且需要更少的参数。

新方法的主要创新如下:

1)这是解决困难的现实世界任意比例图像SR问题的第一项工作。此外,还为此任务构建了第一个数据集。它可以作为在现实世界中训练和测试任意比例图像SR模型的基准。

2)提出了局部混合隐式网络,该网络同时考虑多个独立的点坐标和特征,以混合方式学习空间纹理信息,以增强对真实世界图像退化的鲁棒性。

3)进行了广泛的实验,通过将结果与最先进的方法产生的结果进行比较,验证了数据集和本地混合隐式网络的有效性。

    在模拟数据集上训练的SR模型难以解决任意尺度,显示出明显的模糊和伪影,如图5-5所示。

图5-5 在模拟数据集上训练的SR模型难以解决任意尺度,显示出明显的模糊和伪影

在图5-5中,结果表明,在模拟数据集上训练的SR模型难以解决现实世界中的任意尺度问题,显示出明显的模糊和伪影。相比之下,方法更自然,性能与现实世界的连续光学变焦效果相当。

COZ数据集的示例序列,如图5-6所示。

 

图5-6  COZ数据集的示例序列

在图5-6中,第一行显示了在35mm至140mm焦距范围内捕获的约60张图像中的11张图像样本。第二行显示了从这些图像中裁剪中心区域后的对齐结果。

构建的自动连续变焦成像系统用于收集数据,如图5-7所示。

图5-7  构建的自动连续变焦成像系统用于收集数据

A—控制器;B—电机;C—传动带;D—光学透镜

COZ数据集统计如图5-8所示。

图5-8  COZ数据集统计

在图5-8(a)是训练数据集中不同放大倍数(从×1.0到×4.0)的图像的分布统计,(b)是场景多样性统计。

改进方法的本地混合隐式网络框架,如图5-9所示。

图5-9  改进方法的本地混合隐式网络框架

5.3.3 结论

介绍COZ技术,这是用于任意比例图像SR的第一个真实世界数据集。COZ使用自动连续变焦成像系统捕获,提供精确对齐的连续分辨率变化图像对。利用MLPmixer和元学习,提出了LMI模型,该模型同时考虑多个独立坐标和相应特征,以混合方式学习空间纹理信息。大量的实验和用户研究验证了数据集和方法的有效性,结果超过了SOTA方法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/855678.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

用于端到端场景图生成的密集关系变换器

用于端到端场景图生成的密集关系变换器 场景图生成旨在捕捉图像中对象之间的详细空间和语义关系,由于标签不完整、长尾关系类别和关系语义重叠,这具有挑战性。现有的基于Transformer的方法要么对对象和谓词采用不同的查询,要么对关系三元组采用整体查询,因此学习低频关系的…

新书推荐《AI芯片开发核心技术详解》、《智能汽车传感器:原理设计应用》

由清华大学出版社资深编辑赵佳霓老师策划编辑的新书《AI芯片开发核心技术详解》已经出版,京东、淘宝天猫、当当等网上,相应陆陆续续可以购买。该书强力解析AI芯片的核心技术开发,内容翔实、知识点新颖、实践性很强、图文并茂。 由清华大学出版社资深编辑赵佳霓老师…

vue3/Nuxt中使用Toast

前言 实在是懒得手写一个toast,于是找了一下。 过程 https://github.com/Maronato/vue-toastification/tree/next vue-toastification这个库很有名,默认是vue2的,如果需要使用vue3,需要在安装时,指定next的tag,比如 pnpm i vue-toastification@next但是这个库的最新版也已…

什么是状态管理,有哪些实现?

概念 “状态管理”是指在应用程序中有效地组织、更新和共享数据的方式。比起数据库和本地之类的持久层,有时我们需要存储一些应用运行过程中的临时数据,其中大部分可能都不会存入数据库。因此,状态这个词还是挺贴切的。比较熟悉的是vue中Pinia提供的状态管理,他是全局可访问…

[计算机网络/Linux] 基于CENTOS7自建DNS服务

序最初的诉求:自建DNS,篡改公开网站的url为自建web服务的url。在使用浏览器进行网上冲浪的时候,我们只需要输入网址即可访问,但是在网络中,网址并不是一个有效的东西,真正起作用的是网址所对应的IP地址,但是IP地址是一堆没有规律的数字,难以记忆、使用,所以就有了DNS服…

[计算机网络] 基于CENTOS7自建DNS服务

序最初的诉求:自建DNS,篡改公开网站的url为自建web服务的url。在使用浏览器进行网上冲浪的时候,我们只需要输入网址即可访问,但是在网络中,网址并不是一个有效的东西,真正起作用的是网址所对应的IP地址,但是IP地址是一堆没有规律的数字,难以记忆、使用,所以就有了DNS服…

systemd[1]: home.mount: Directory /home to mount over is not empty, mounting anyway.

日志显示这些内容说明可能是 fstab 服务自动挂载之前 /home 不为空systemd[1]: home.mount: Directory /home to mount over is not empty, mounting anyway. ░░ Subject: 挂载点不为空 ░░ Defined-By: systemd ░░ Support: http://www.ubuntu.com/support ░░ ░░ 目…

Linux服务器上部署Redis流程

前言 Redis版本7.0.4 服务器版本:Linux CentOS 8.0 64位 1.下载Redis 进入官网找到下载地址 https://redis.io/download 进入到Xshell控制台(默认当前是root根目录),输入wget 将上面复制的下载链接粘贴上,如下命令: wget http://download.redis.io/releases/redis-7.0.4.tar…

[Tools] Buzz – 免费开源的AI语音转文字工具

Buzz 介绍 https://github.com/chidiwilliams/buzz Buzz是一款基于OpenAI Whisper模型构建的离线语音转文字工具,适用于Windows、macOS和Linux系统。Buzz能将麦克风输入或音频、视频文件实时转换为文字,支持多种格式导入导出,如TXT、SRT和VTT。Buzz的转换速度快,准确率高,…

Skipping题解(贪心,队列,迪杰斯特拉,思维)

原题链接 https://codeforces.com/problemset/problem/2023/B 大致题意 类似一个游戏游戏规则如下:从1开始,可以选择吃掉ai,之后只能选择比当前下标小的(明显,如果开始就选择吃掉a1,那么游戏就结束了)。 当然还可以选择不吃ai,那么可以跳到[1,b[i]](b[i]与i的大小关系…

arcpy开发初探

是第一次将软件操作和书写代码合二为一 一、配置环境 arcpy是无法pip下载到的,只有满足以下条件才能调用到: 1、运行代码时候需要使用arcgis下面的python做编译器去运行 2、arcmap是需要启动着的 先写个测试代码 import arcpy print(arcpy.GetInstallInfo()[Version]) input_…

2024-2025-1 20241322 《计算机基础与程序设计》第13周学习总结

2024-2025-1 20241322 《计算机基础与程序设计》第13周学习总结 作业信息这个作业属于哪个课程 https://edu.cnblogs.com/campus/besti/2024-2025-1-CFAP这个作业要求在哪里 https://www.cnblogs.com/rocedu/p/9577842.html#WEEK13这个作业的目标 《C语言程序设计》第12章并完…