HDR-HexPlane:首个针对高动态场景的HDR-NERF框架

导读: 本文提出了一种可以高效学习HDR动态场景的神经辐射场方法——HDR-HexPlane。在新视图合成方面,该模型可以考虑过曝和欠曝的颜色区域,在动态HDR场景数据集上取得了最先进的结果。

论文标题:Fast High Dynamic Range Radiance Fields for Dynamic Scenes
论文作者:Guanjun Wu, Taoran Yi, Jiemin Fang, Wenyu Liu, Xinggang Wang
项目地址:https://guanjunwu.github.io/HDR-HexPlane/

1. 摘要

神经辐射场(NeRF)和它的扩展在三维场景表示和新视图图像合成方面显示表现优异。但是,大多数NeRF方法都采用低动态范围(LDR)图像,这可能会丢失场景细节,尤其是在不均匀照明的情况下。之前的一些NeRF方法试图引入高动态范围(HDR)技术,但还是针对静态场景。为了拓展HDR NeRF方法的应用场景,我们提出了一个动态HDR NeRF框架——HDR-HexPlane,它可以从动态2D图像中学习3D场景,这些图像是用不同的曝光值捕获的。我们构建了一个可学习的曝光映射函数来获得每个图像的自适应曝光值。基于单调递增的先验知识,设计了一个相机响应函数用于稳定学习。利用我们提出的模型,任何时间点的高质量新视图图像都可以用任何期望的曝光值渲染。我们进一步构建了一个包含多个动态场景的数据集,这些场景是用不同的曝光值捕获的,用于评估我们的方法。

在这里插入图片描述图1|我们的方法可以从动态场景中合成不同视角和不同曝光度的图像,并生成HDR图像。通过应用色调映射函数,我们可以获得更好的颜色平衡,提高图像的视觉质量。

2. 文章贡献

• 提出了一种端到端的NeRF框架,即HDR-HexPlane,用于高动态范围动态场景表示,允许基于不同曝光水平捕获的图像对场景进行高效学习和新视图合成。HDR-HexPlane可以按需调整曝光水平,并考虑过曝和欠曝区域渲染平衡图像。

• 提出了一种自适应算法,用于有效准确地学习每幅捕获图像的曝光值,免除了相机曝光参数过程的要求。

• 制作了一个包含动态场景的数据集,这些场景是在单相机和多相机设置下以不同的曝光值捕获的。这个数据集可作为评估HDR动态场景中新视图合成的基准。

我们采用了基于HexPlane的表示来学习动态场景,并提出了一个学习图像曝光的模块。相机响应函数被设定为一个已知的Sigmoid函数。我们在Blender中构建了一个包含8个场景的数据集,每个场景包含80-700张图像。实验结果表明,与其他模型相比,我们的方法在大多数评估指标上都取得了显著提升,并将训练速度提高了10倍以上。

3. 方法详解

在这里插入图片描述图2|我们的方法的整体框架。我们首先从相机中投射多条射线,并从每条射线上采样一系列点。这些点以及当前的时间戳和方向被输入到HexPlane模块中。HexPlane模块计算每个点的辐射值和密度,使我们能够使用体积渲染方程渲染HDR图像。同时,曝光映射模块学习每幅图像的对数曝光系数。我们将辐射值与使用相机响应函数计算的颜色相乘,然后使用体积渲染方程渲染对应的LDR图像。

3.1 预备知识

· HDR-NeRF

NeRF利用隐式场景表示和体积渲染方程,实现了高质量的新视图合成。HDR-NeRF引入了相机响应函数学习、色调映射和场景曝光时间的概念,使NeRF能够以不同的曝光值作为输入进行训练,并执行HDR视点合成。对每条射线通过沿着射线对一系列点进行采样。对于每个点和方向,HDR-NeRF采用MLP网络来计算对数空间灰度值和体积密度。

接着,结合对数曝光值,最后应用MLP来拟合相机响应函数,得到最终的空间颜色值。使用体积渲染方程将每个点沿射线的空间颜色值和体积密度聚合起来,得到像素颜色。

颜色值和曝光值是已知的,而辐射度和相机响应曲线是未知的。在这种情况下,将辐射值缩放并给相机响应曲线一个对数偏移可能会得到相同的结果。因此,使用零点约束将固定为一个常数,为相机响应函数提供了合适的先验知识。

总损失由重构损失和零点约束损失相加得到。

· HexPlane

HexPlane是一种有效的动态场景重建表示。它将时间和空间信息结合到6个可学习的参数平面中。

给定位置和时间,将它们作为查询向量,通过6个双线性插值和一个向量矩阵乘积来计算隐藏信息。同时,位置、时间和视角被编码成高维变量;然后将所有变量连接在一起,并输入到一个单独的MLP中,以输出空间颜色和密度。最后,使用体积渲染方程计算集成颜色。

3.2 整体框架

由于输入图像是在不同曝光值下捕获的LDR图像,场景的几何信息不随曝光变化而改变。在训练期间,对于每条射线的原点、方向和时间,我们在射线上的近端和远端之间进行采样,然后使用HexPlane计算点的体积密度和对数空间灰度值。

接着,我们用函数结合对数空间灰度值和对数曝光系数计算点的空间颜色值,其中曝光值由图像索引决定。

我们可以使用体积渲染方程计算最终结果。空间颜色值和体积密度被组合得到像素颜色,而空间灰度值和体积密度被用于计算像素灰度(整个框架如图2所示)

我们设计的模块显式地分离了动态场景的建模和场景照明的学习,从而解决了由于物体从暗区移动到亮区导致的多视角动态场景中的颜色不一致的问题。具体而言,我们让HexPlane独立于曝光学习动态场景,仅预测其空间灰度值和体积密度。曝光学习和相机响应函数模块然后将HexPlane输出的空间灰度值映射到不同曝光值的相应LDR值,与独立于曝光的体积密度相结合,从而渲染出具有几何一致性的LDR图像。

3.3 曝光映射

遵循传统的HDR图像恢复流程,我们也将空间灰度值和曝光值映射到对数域中。

在从不同视点执行射线采样时,可能会重复地选择某些点。根据体积渲染方程,这些采样点用于计算它们各自的空间颜色值。因此,对于由相同的相机设置但在不同曝光值下捕获的真实图像,颜色一致性仍然成立。因此,我们认为这些图像对应的曝光值可以联合优化。这一观察使我们相信,学习对应的曝光系数是可行的。具体而言,对于每个图像索引,我们为其分配一个特征嵌入,然后利用一个曝光来计算它的曝光值。

使用曝光MLP可以确保更平滑地优化曝光嵌入,并促进收敛。在我们的流程中,我们将相机响应函数指定为固定的,并将其设置为Sigmoid函数。相反,我们使用可训练的参数来学习曝光值。

3.4 相机响应函数

HDR-NeRF提出了一个可训练的相机响应函数(CRF)和已知的曝光值。当曝光值未知时,估计CRF和曝光值可能会变得困难。为了解决这个问题,我们将CRF固定为一个已知的函数,该函数应该满足以下条件:

1)单调递增和平滑的;
2)有上下限以将其范围限制在0到1之间。

因此,我们考虑使用Sigmoid函数作为CRF的公式。

这意味着在训练HDR-HexPlane时,我们允许模型在输入LDR图像中学习不同的曝光值,而学习到的曝光值在不同的场景之间也是可比较的。此外,显式确定相机响应函数的公式可以为辐射场提供一个良好的先验分布,有助于训练期间的收敛。

3.5 优化

作为基于体素的神经辐射训练方法之一,我们也使用MSE损失和总变分(TV)损失作为优化的监督。同时,我们也采用了空置体素跳过和由粗到细的训练来正则化和加速优化。

4. 实验

本方法在合成质量和运行速度方面,优于现有的动态NeRF方法。我们的方法在大多数指标上,均取得了SOTA。本方法可以从不同曝光度的图像中学习HDR辐射场,并合成任意曝光度的新视图。本方法还可以考虑过曝和欠曝区域的颜色平衡,生成更自然的图像。

在这里插入图片描述表1|不同模型的比较显示,HDRHexPlane不仅在高速重建动态场景方面表现出色,而且还展示了合成HDR图像的能力。

在这里插入图片描述表2|实验结果显示,我们的方法作为第一个处理多视频输入的变化曝光的模型,在大多数指标上优于其他模型。最好和第二好的结果分别用粉色和黄色表示。

在这里插入图片描述表3|所有合成数据集的平均指标。表中的训练时间是所有场景的平均训练时间。

在这里插入图片描述
图3|合成数据集的结果,所有图像都以LDR渲染。

在这里插入图片描述
图4|消融实验结果。

在这里插入图片描述
图5|学习对数曝光系数的比较。

5. 结论

在本文中,我们提出了HDR-HexPlane,它将HDR成像和动态场景表示方法集成在一起,以有效学习HDR动态场景。对于新视点合成,通过考虑过曝和欠曝的颜色区域,在用一个或多个相机以多重曝光图像捕获的动态场景数据集上取得最先进的结果。

编译|Deep蓝同学
审核|Los
本文首发于公众号【深蓝AI】,若要第一时间获取自动驾驶、人工智能与机器人行业最新最前沿论文和科技动态,请移步公众号【深蓝AI】。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/415950.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

RK3568平台 LT9211转接芯片调试笔记

一.简介 龙讯LT9211是一个高性能转换器,支持MIPI LVDS TTL两两之间转换。 使用此款芯片大部分为MIPI与LVDS进行互相转换。 下图为LT9211的典型应用图: 二.LT9211原理图 三.车载显示器和摄像头系统 四.调试LT9211输出 MIPI数据 (1&#xf…

【银行测试】银行项目,信用卡业务测试+常问面试(三)

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 银行测试-信用卡业…

P3952 [NOIP2017 提高组] 时间复杂度————C++

目录 [NOIP2017 提高组] 时间复杂度题目背景题目描述输入格式输出格式样例 #1样例输入 #1样例输出 #1 提示 解题思路Code运行结果 [NOIP2017 提高组] 时间复杂度 题目背景 NOIP2017 提高组 D1T2 题目描述 小明正在学习一种新的编程语言 A,刚学会循环语句的他激动…

多测师肖sir___ui自动化测试po框架(升级)

ui自动化测试po框架(升级) po框架 一、ui自动化po框架介绍 (1)PO是Page Object的缩写(pom模型) (2)业务流程与页面元素操作分离的模式,可以简单理解为每个页面下面都有一…

西瓜书读书笔记整理(十一) —— 第十一章 特征选择与稀疏学习

第十一章 特征选择与稀疏学习 11.1 子集搜索与评价11.1.1 基本概念11.1.2 为什么要进行特征选择11.1.3 特征选择的两个关键环节11.1.4 常见的特征选择方法11.1.5 其他问题 11.2 过滤式选择11.2.1 什么是过滤式选择方法11.2.2 过滤式选择的优缺点 11.3 包裹式选择11.3.1 什么是包…

定时关机应用V2.1

# 在ShutDown_2.0的基础上,作了如下改进: # 1) 修正了默认模式无法选择其他时间的bug,还增加了2.5小时和3小时两个选项; # 2)自定义模式将计时单位从“秒”改为“分钟”,倒计时显示也优化为“小时:分钟:秒”…

未来能源转型之路:2023年第十三届中国国际储能大会启示录

在2023年第十三届中国国际储能大会上,全球各地的能源专家、学者和企业代表齐聚一堂,共同探讨了储能技术在推动能源转型中的重要作用。对于我们普通人来说,从这场大会中可以学到什么呢? 一、储能技术是未来能源发展的关键 随着可再…

Red Hat Enterprise Linux 7.9 安装图解

引导和开始安装 选择倒计时结束前,通过键盘上下键选择下图框选项,启动图形化安装过程。需要注意的不同主板默认或者自行配置的固件类型不一致,引导界面有所不同。也就是说使用UEFI和BIOS的安装引导界面是不同的,如图所示。若手动调…

Go后端开发 -- 反射reflect 结构体标签

Go后端开发 – 反射reflect && 结构体标签 文章目录 Go后端开发 -- 反射reflect && 结构体标签一、反射reflect1.编程语言中反射的概念2.interface 和反射3.变量内置的pair结构4.reflect的基本功能TypeOf和ValueOf5.从relfect.Value中获取接口interface的信息6…

微服务研发时,多个人共同调试一个服务,在nacos会启动多个实例,导致请求服务接口时在你和别人之间来回轮询问题处理

1、问题描述 当我们有两个研发同时在调试一个微服务模块时,你和对方本地都会启动服务,这就导致在nacos会同时注册两个实例。默认情况下请求这个服务,具体处理请求的程序会在你和对方之间来回轮询,即一下你的服务一下对方的服务。…

erlang (OS 操作模块)学习笔记

cmd: env: 返回所有环境变量的列表。 每个环境变量都表示为元组 {VarName,Value},其中 VarName 是 变量和 Value 其值。 例: {VarName,Value} {"ERLANG_HOME","C:\\Program Files\\erl-24.3.4.2\\bin\\erl-24.3.4.2"}…

将 SQL Server 2022 数据库备份到 MinIO

Microsoft 在将 S3 连接器和 Polybase 添加到 SQL Server 2022 时取得了重大飞跃。因此,企业可以利用他们保存到对象存储中的大量数据,并使用它来丰富 SQL Server 表。他们还可以利用对象存储来备份 SQL Server,这是开放性和云原生灵活性的又…