论文阅读记录-2025-03-19

news/2025/3/19 19:22:33/文章来源:https://www.cnblogs.com/wawcac-blog/p/18781199

目录
  • Frequency-Aware Density Control via Reparameterization for High-Quality Rendering of 3D Gaussian Splatting
    • 动机
    • 方法
      • scale的重参数化
      • 频率感知的密度控制
      • 基于scale的高斯点置信度
    • 实验设置
    • 消融实验
  • 3D-HGS: 3D Half Gaussian Splatting
    • 动机
    • 方法
    • 实验
  • FreGS: 3D Gaussian Splatting with Progressive Frequency Regularization
    • 动机
  • nothing

Frequency-Aware Density Control via Reparameterization for High-Quality Rendering of 3D Gaussian Splatting

FDS-GS arxiv code

华中科技大学,AAAI 2025

动机

传统3DGS的密度控制(高斯增减)只孤立地考虑单个高斯点的梯度值和尺度,没有把多个高斯点之间的关系考虑进来,造成高频区域的高斯点之间存在重叠、浪费。

因此,考虑在高斯点分裂后,根据KNN高斯点的分布,重参数化scale值

方法

scale的重参数化

在对高斯点进行增减以后,重新修改高斯球的scale,和原版GS的初始化scale的思想有点像。

具体方法:每个高斯点到其KNN的加权平均距离(权重与距离负相关),用该距离与KNN的K计算出一个单位空间点数,作为该高斯点的邻域“密度”,进而求出一个缩放系数,该高斯点的三个scale乘以同一个系数进行缩放。实验中,K取50。

剩下2个部分都是补充解决scale重参数化的问题。

频率感知的密度控制

原版3DGS中,引导高斯点分裂的梯度阈值固定,不好调参,因此改成\(\max(g_{fixed},g_{25\%})\),即预设的阈值与25%分位数的最大值,效果就是每次最多分裂25%的高斯点。可惜我当年为了尽快出效果,来不及写代码,整了个随机放弃到25%的烂活

基于scale的高斯点置信度

有的高斯点会被分裂到物体内部,远离表面,造成对点云密度的错误估计,因此需要删除内部看不到的点。

具体方法:

  1. 单个高斯点投影到不同视角,都能获得一片椭圆形像素区域(区域F有多大?)。对于该2D区域内每个点(每个像素?),求2D高斯分布的概率密度,所有点的概率密度相加再乘以透明度,就能获得这个高斯点在该视角下的贡献值。

    高斯分布的性质那么好,感觉贡献值只和投影区域内有效的像素数量、透明度2个值有关。

  2. 对于每个高斯点,其在每个视角的投影区域F中再采样49个点(中心点,以及6圈*8个方向),这49个点构成集合S。集合S内的点分别求2D高斯分布的概率密度,获得49个概率密度作为权重。再从该视角的渲染图上求出49个对应的颜色。于是每个高斯点在每个视角都有49个加权颜色。

  3. 对于每个高斯点,找到其贡献值最大的M个视角,贡献最大的视角的49个加权颜色和剩下M-1个视角的49个加权颜色求加权SSIM,这M-1个SSIM的均值就是该高斯点的置信度。

    找到贡献值最大的M个视角,号称用了CUDA加速的堆排序,实际上M只有2……

感觉这样求置信度的方法比较新颖,但对区域F的定义和作用还有疑惑,F是像素集合还是亚像素点的集合?这个方法对训练速度的影响应该不小(尽管用了一些CUDA加速),而且单个高斯点覆盖的像素数量够多吗?像素级别求SSIM会不会不太够?

实验设置

单张A100

数据集(对标原版3DGS)

  • Mip-NeRF360
  • Tanks&Temples
  • Deep Blending

指标:SSIM LPIPS PSNR

基线方法

  • iNGP
  • Mip-NeRF360
  • 3DGS(包括论文提供的和复现的结果)
  • Scaffold-GS(复现结果)
  • MipSplatting(复现结果)
  • 3D-HGS(复现结果)
  • FreGS

消融实验

只在MipNeRF360数据集上进行,关注了高斯数量。多角度评价,不以图像质量作为唯一指标,各个维度都比基线高就行了

D&S linking dyna. thres. conf. filter SSIM↑ PSNR↑ LPIPS↓ Gauss.Num.↓
0.813 27.48 0.221 3174k
0.827 27.65 0.178 5442k
0.831 27.75 0.178 3770k
0.836 27.97 0.175 3123k
0.835 27.95 0.180 2370k

疑问、缺憾

  • 对区域F的定义和作用存疑,感觉有点多余
  • 训练用时、收敛速度没说,特别是KNN和置信度过滤的部分的用时占比

3D-HGS: 3D Half Gaussian Splatting

3D-HGS arxiv code

东北大学,CVPR 2025

动机

表示高频信号需要很多个高斯基元。但如果把高斯分布沿着中间切开,只用半个,切开的平面就能更好地表示锐利的边缘。

方法

给每个高斯增加4个参数:切平面的法向量、另一半的透明度。

推导半高斯的光栅化前向和反向公式,并修改光栅化器。能动渲染方程的都是真男人

光栅化器甚至区分了半高斯1、半高斯2、来自半高斯1的切面1、来自半高斯2的切面2四个部分,非常solid。

实验

单卡3090,数据集对标3DGS

作为一个即插即用的组件,在多个基线上增加了该插件,在推理FPS基本不变的前提下,将PSNR提高了0.2到0.5dB不等。把单独的方法变成插件,需要好多实验来证明泛用性

  • 3DGS、Mip-Splatting、HGS-MCMC:代码屎山里有个三维法向量没用,因此只新增了另一半透明度这一个新参数
  • Scaffold-GS:给MLP输出新增了4个参数

FreGS: 3D Gaussian Splatting with Progressive Frequency Regularization

FreGS paper code

南洋理工 CVPR 2024

动机

对图像进行FFT,在频域的相位和振幅上进行退火式的监督(从低频到高频逐渐放开),从而为不同频率的高斯点分裂提供不同的阈值。

本文深入研究了阈值需要改变的原因,比某人当年手动调阈值scheduler高到不知道哪里去了

nothing

试试用这种方法记录论文,不然读过都不记得了

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/901661.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

day:25 selenium之介绍和环境配置

一、selenium介绍 selenium是一个第三方库,python有很多库; 1、什么是ui自动化? 通过模拟手工操作用户ui页面的方式,用代码去实现自动化操作和验证的行为。 2、ui自动化的优点? (1)解决重复性的功能测试和验证 (2)减少测试人员在回归测试时用例漏测和验证点的漏测 (3…

[算法学习记录] [更新中]最短路

顾名思义,最短路算法,就是求一个图中所有的点距某一个点的最短距离,常见的有Dijkstra算法、Bellman-Ford算法、Johnson算法与Floyd算法。 Dijkstra Dijistra算法实际上是一种由贪心与动态规划结合的算法,我们每次都贪心地选择到某个点的最近距离,又动态地更新着距离数组d的…

day6-static静态变量

静态变量/静态方法 被static修饰 工具类静态方法不能调用非静态。 非静态可以访问所有。 继承一个子类只能继承一个父类,可以多层继承,最大的父类为Objectcoding 练习:更好的方法:双指针不浪费空间

SpringBoot引入JWT实现用户校验

一JWT JWT(JSON Web Token)是一种开放标准(RFC 7519),用于在网络应用环境间安全地传输信息。这些信息以JSON对象的形式存储在令牌中,并且可以被签名和加密。JWT通常用于身份验证和信息交换主要用途 身份验证:当用户登录成功后,服务器会生成一个JWT并返回给客户端。之后…

mcp-playwright测评

mcp-playwright介绍 mcp-playwright是一个使用 Playwright 提供浏览器自动化能力的模型上下文协议服务器。该服务器使 LLMs 能够与网页交互、截屏,并在真实的浏览器环境中执行 JavaScript。 GitHub地址:https://github.com/executeautomation/mcp-playwright。安装 npm insta…

传媒行业项目管理全解析:日事清在流程、文件、数据与风控中的一体化应用

一、关于森可文化 森可文化传媒有限公司(Senke Vision)占据了超过2800平方米的宽敞办公及拍摄场地,与众多内衣及服饰行业的上市巨头建立了不可动摇的深度合作关系。 Senke Vision汇聚了国内外顶尖的策划、设计、摄影摄像、服装搭配、化妆及品牌视觉顾问,形成了一支独一无二…

在 .NET 项目中使用 husky 完成 pre-commit 操作

将 husky 引入 .NET 项目Husky 是一个用于 Git 仓库的工具,主要用于管理 Git 钩子(hooks)。它可以帮助开发者在特定的 Git 操作(如提交、推送等)之前或之后执行自定义的脚本或命令,从而提高代码质量和团队协作效率。 主要用在前端项目中,可以通过 Husky.Net,将 Husky 的…

贸易企业数字化转型案例:基于日事清的目标管理、任务协作与流程可视化绩效优化实践

这家贸易公司如何提升内部协同效率?一、基本情况 所属行业:传统贸易行业 业务类型:国内贸易、货物及技术进出口 行业地位:拥有自己的研发人员,具备一站式解决方案能力。 合作概要:为解决组织提效,目标体系、协同体系、绩效体系的管理问题,客户与日事清达成合作,并将日…

使用nvm管理node.js版本

1.情景展示如上图所示,项目某个模块支持的node.js最高版本是17,我用的是20,所以只能降级。 2.具体分析 我现在把node.js降到16,那后续如果再需要20呢?能不能实现版本的随时切换? 3.安装nvm 我们可以使用nvm来管理node.js的版本。 下载nvm windows下载地址:https://githu…

3.19 学习记录

完成了仓库管理系统的制作,基本无bug,所展示功能都可以实现,基于 springboot 和 vue3 具体实现如下: 登录管理员页面 有仓库管理,物资管理,库存管理和统计功能仓库工作人员页面

网站测速——提升用户体验的关键

在互联网飞速发展的今天,网站已成为企业展示形象、提供服务以及用户获取信息的重要平台。而网站的速度,如同高速公路的路况,直接影响着用户的访问体验和满意度。因此,网站测速成为了网站运营和维护中不可或缺的关键环节。 网站速度对企业来说真的那么重要吗?​ 网站测速的…

表单和载荷的区别,以及python和js在处理json时的空格问题。

1、在 传载荷的时候,用json= 这样传底层会调用json.dumps来转换,如:response = requests.post(url,headers=headers,params=params,data=json.dumps(data.separators=(,":")) 2、在 传表单的时候,用data= 如:response = requests.post(url,headers=headers,…