论文学习 BioNeRF: Biologically Plausible Neural Radiance Fields for View Synthesis

论文学习 BioNeRF: Biologically Plausible Neural Radiance Fields for View Synthesis

  • 前言
  • 简介
  • NeRF介绍
  • BioNeRF
    • 位置编码提取
    • 感知过滤
    • 记忆更新
    • 纹理推断
    • 损失函数
  • 量化验证
  • 总结

前言

虽然我不应该再看NeRF相关的东西了,但是我还是觉得这个论文的题目很有意思,毕竟我认为神经网络本来就是模拟生物大脑的一个模型,那么我们应该更多的注意一些生物的机制,这些机制如果能得以很好的建模,或许能为神经网络结构下一步的开发提供思路。

简介

不同于NeRF依赖神经网络的权重来存储三维信息,BioNeRF利用感知启发的方式来融合多种输入,来改进模型中的记忆模块。并且该模型模拟了视锥细胞的功能,使其专注于纹理信息的提取。因此在这个意义上,记忆模块实际上是对形状信息和纹理信息进行组合。

论文链接
GitHub

(ps.感觉有种水论文讲故事的感觉)

NeRF介绍

在这里插入图片描述
( R , G , B , Δ ) = F θ ( x , y , z , θ , ϕ ) c ( x , y , z , θ , ϕ ) = ∫ ( R , G , B ) i Δ i d i (R,G,B, \Delta)=F_\theta(x,y,z,\theta,\phi) \\ c(x,y,z,\theta,\phi )=\int(R,G,B)_i\Delta_idi (R,G,B,Δ)=Fθ(x,y,z,θ,ϕ)c(x,y,z,θ,ϕ)=(R,G,B)iΔidi
NeRF本质上是利用一个MLP,来对一个五元组输入,输出一个四位输出,包含当前点的RGB三色,以及其密度 Δ \Delta Δ。因此可以认为,物体的三维信息实际上保存在模型参数中。这也极大的节省了内存,是一种高效利用内存的技术。

NeRF其中一个关键概念是,它将复杂的真实世界的三维表示编码为神经网络的参数。此外,该模型将体积密度预测限制为相机位置的函数,从而允许RGB颜色预测为位置和观看方向的函数。这些概念类似于受神经科学发现和锥体细胞原理启发的一些生物学上更合理的研究,特别是关于引导信息流的环境和整合记忆的想法,负责根据过去的经验提供额外的环境。

BioNeRF

在这里插入图片描述

位置编码提取

在这里插入图片描述
第一步,将图像输入同时输入两个独立的神经网络 M Δ , M c M_\Delta, M_c MΔ,Mc,两者的结构虽然相同,但是并不共享参数。

感知过滤

ps . 我们称这些为过滤的主要原始是,他会将输入特征映射到[0,1]区间。
这一阶段主要是针对上一阶段得到的特征编码进行进一步计算,有四种过滤方式:密度 f Δ f_\Delta fΔ、颜色 f c f_c fc、记忆 f Ψ f_\Psi fΨ、调整(调制) f μ f_\mu fμ
f Δ = σ ( h Δ ) f c = σ ( h c ) f Ψ = σ ( W Ψ [ h Δ , h c ] + b Ψ ) f μ = σ ( W μ [ h Δ , h c ] + b μ ) f_\Delta = \sigma(h_\Delta) \\ f_c = \sigma(h_c) \\ f_\Psi = \sigma(W_\Psi[h_\Delta,h_c]+b_\Psi) \\ f_\mu = \sigma(W_\mu[h_\Delta,h_c]+b_\mu) fΔ=σ(hΔ)fc=σ(hc)fΨ=σ(WΨ[hΔ,hc]+bΨ)fμ=σ(Wμ[hΔ,hc]+bμ)
其中 σ \sigma σ是sigmoid函数。

预调制 γ \gamma γ满足:
γ = t a n h ( W γ [ h Δ , h c ] + b γ ) \gamma = tanh(W_\gamma[h_\Delta,h_c]+b_\gamma) γ=tanh(Wγ[hΔ,hc]+bγ)

记忆更新

首先需要先进行一步计算如下。·
μ = f μ ⊗ γ \mu = f_\mu \otimes \gamma μ=fμγ

作为新的信息,之后用下式更新记忆内容:
Ψ = t a n h ( W Ψ ( μ + ( f Ψ ⊗ Ψ ) ) + b Ψ ) \Psi=tanh(W_\Psi(\mu+(f_\Psi\otimes\Psi)) + b_\Psi) Ψ=tanh(WΨ(μ+(fΨΨ))+bΨ)

纹理推断

利用前文更新的记忆以及得到的结果,还有相机位姿,concat得到新的特征 h Δ ′ , h c ′ h'_\Delta,h'_c hΔ,hc:
h Δ ′ = [ Ψ ⊗ f Δ , I ] h c ′ = [ Ψ ⊗ f c , d ] I = ( x , y , z ) d = ( θ , ϕ ) h'_\Delta=[\Psi\otimes f_\Delta,I]\\ h'_c=[\Psi \otimes f_c, d]\\ I=(x,y,z)\\d=(\theta,\phi) hΔ=[ΨfΔ,I]hc=[Ψfc,d]I=(x,y,z)d=(θ,ϕ)
再利用两个独立的神经网络作为解码器,得到 c , Δ c, \Delta c,Δ

损失函数

就是纯粹的损失函数。

量化验证

在这里插入图片描述

总结

感觉还是有点失望吧,这篇文章虽然说,是模仿生物视觉成像,不过依然存在以下问题:

  1. 生物中的记忆力表示,能否仅仅表示为一个张量呢?这种记忆力,是否可能也是作为一个神经网络,以参数的形式进行表示呢?
  2. 对比CodeNeRF,PixelNeRF等单视点成像的NeRF研究而言,改模型甚至难以单视点成像,是否说明其本身对于三维形状的提取还不如前两篇文章呢?
  3. 实际上不难发现,这篇文章提到的神经网络实际上参数量很大,性能的提升,是否可能主要受到参数量的影响呢?
  4. 这种记忆力机制,能否由一个Triplane来表示呢?感觉应该能起到相同的效果,甚至说,如果你认为Triplane不行,我们可以造两个Triplane,分别表示色彩和形状?如此说来这不是更复合生物特征?
  5. 文中提到的记忆力更新,感觉可以类比为一种kqv的注意力机制不是吗?感觉有编故事的嫌疑。

优点:
1.提到了记忆机制,这或许为解释Triplane在NeRF中非常有效的原因,因为Triplane实际上提供了一种记忆机制。
2.结果好。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/484129.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

一文穿透线程池,从此吊打面试官

目录 一、什么是线程池? 为什么要使用它? 二、什么是Executor框架? 三、什么是阻塞队列?如何使用阻塞队列来实现生产者-消费者模型? 四、常见线程池的快捷创建方式 五、为什么不建议使用 Executors静态工厂构建线…

六、回归与聚类算法 - 欠拟合和过拟合

目录 1、定义 2、原因及解决方法 2.1 正则化 线性回归欠拟合与过拟合线性回归的改进 - 岭回归分类算法:逻辑回归模型保存与加载无监督学习:K-means算法 1、定义 2、原因及解决方法 2.1 正则化

windows极限摸鱼软件(仅6678kb)

时间过得真快啊,不知不觉春节假期就过完了。你已经开始工作了吗?反正我是一直没闲着。 歇的时间久了,一上班这节奏很难一下子转换过来。也可能刚上班,没什么事情做,有点无聊。 (好吧,我承认了…

外卖柜平台的设计与实现以及实践与总结

近年来,外卖行业的快速发展推动了外卖配送行业的进步和创新。外卖柜平台作为一种新兴的配送方式,在提高配送效率和服务质量方面具有很大的优势。本文将探讨美团外卖柜平台的设计与实现,以及如何保障其稳定性和安全性。 架构设计 美团外柜平台…

2024最佳住宅代理IP服务商

跨境出海已成为了近几年的最热趋势,大批量的企业开始开拓海外市场,而海外电商领域则是最受欢迎的切入口。新兴的tiktok、Temu,老牌的Amazon、Ebay,热门的Etsy、Mecari等等都是蓝海一片。跨境入门并不难,前期的准备中不…

【鸿蒙 HarmonyOS 4.0】TypeScript开发语言

一、背景 HarmonyOS 应用的主要开发语言是 ArkTS,它由 TypeScript(简称TS)扩展而来,在继承TypeScript语法的基础上进行了一系列优化,使开发者能够以更简洁、更自然的方式开发应用。值得注意的是,TypeScrip…

2/22作业

1.按位置插入 void insert_pos(seq_p L,datetype value,int pos) { if(LNULL) { printf("入参为空\n"); return; } if(seq_full(L)) { printf("表已满\n"); return; } if(pos>L->len|…

MATLAB 导出可编辑的eps格式图像

任务描述:部分期刊要求提交可编辑的eps格式图像,方便美工编辑对图像进行美化 我试了直接print或者在figure窗口导出,发现导出的文件放到Adobe AI中并不能编辑,经Google找到解决办法: %EPS exportgraphics(gcf,myVect…

鱼哥赠书活动第⑧期:《基础软件之路:企业级实践及开源之路》

鱼哥赠书活动第⑧期:《基础软件之路:企业级实践及开源之路》 作者介绍:1.静态分析工具在当前软件开发流程中的应用2.编译相关技术在静态分析工具中的应用3.编译相关技术在提升软件质量和性能上的更多应用4. 未来展望图书推荐:赠书…

分析型数据库(Apache Doris)是如何实现高效的数据更新?

SelectDB 是基于 Apache Doris (分析型数据库)构建的现代化数据仓库,支持大规模实时数据上的极速查询分析,主要用于 OLAP 场景下对大规模数据进行快速分析和查询,它支持多维分析、实时查询、增量更新、高效的数据更新等…

Linux 安装RocketMQ

官网: https://rocketmq.apache.org/zh/安装RocketMQ 5.2.0 下载、解压即完成部署。 wget https://dist.apache.org/repos/dist/release/rocketmq/5.2.0/rocketmq-all-5.2.0-bin-release.zip unzip rocketmq-all-5.2.0-bin-release.zip启动之前修改jvm启动内存 …

STM32G030C8T6:定时器1ms中断(以64MHz外部晶振为例)

本专栏记录STM32开发各个功能的详细过程,方便自己后续查看,当然也供正在入门STM32单片机的兄弟们参考; 本小节的目标是,系统主频64 MHZ,采用高速外部晶振,通过定时器3 每秒中断控制 PB9 引脚输出高低电平,从…