【可视化3D卷积计算过程】

目录

  • 1. 可视化过程
  • 2. 代码验证

前言:开始处理视频数据,遇到了陌生又熟悉的3D卷积,但对其计算过程有点疑惑,网上也没找到什么可视化动画,所以研究明白并做个记录,方便日后复习。有点简化,但认真琢磨一下图片和代码肯定能看明白:)

1. 可视化过程

3D卷积可以用来处理视频输入,对于图片来讲,shape为:[C_in, H, W]。而视频多了时间这一维度,因此视频的shape为:[C_in, D, H, W],其中D为帧数(frame),比如一条视频有10帧,则D=10。(以上都忽略了batch size N)

假如我们现在的输入的视频shape为:[3, 7, 4, 4]。即:

input_channelframeHW
3744

kernel shape为:[5, 3, 2, 2, 2]

output_channelinput_channelkernel_Dkernel_Hkernel_W
53222

在这里插入图片描述

计算过程可视化如下:

在这里插入图片描述
在这里插入图片描述
output shape为:[5, 6, 3, 3],其中:

output_channeloutput_Doutput_Houtput_W
5633

2. 代码验证

import torch
import torch.nn as nnN, C_in, D, H, W = 1, 3, 7, 4, 4
C_out = 5
m = nn.Conv3d(in_channels=C_in, out_channels=C_out, kernel_size=2, stride=1, bias=False)
inputs = torch.zeros(N, C, D, H, W)m.weight = nn.Parameter(torch.ones(C_out, C_in, 2, 2, 2))inputs[:, 0, :, :, :] = torch.ones(D, H, W)
inputs[:, 1, :, :, :] = torch.ones(D, H, W) * 2
inputs[:, 2, :, :, :] = torch.ones(D, H, W) * 3output = m(inputs)
print(inputs, inputs.shape)"""
tensor([[[[[1., 1., 1., 1.],[1., 1., 1., 1.],[1., 1., 1., 1.],[1., 1., 1., 1.]],[[1., 1., 1., 1.],[1., 1., 1., 1.],[1., 1., 1., 1.],[1., 1., 1., 1.]],[[1., 1., 1., 1.],[1., 1., 1., 1.],[1., 1., 1., 1.],[1., 1., 1., 1.]],[[1., 1., 1., 1.],[1., 1., 1., 1.],[1., 1., 1., 1.],[1., 1., 1., 1.]],[[1., 1., 1., 1.],[1., 1., 1., 1.],[1., 1., 1., 1.],[1., 1., 1., 1.]],[[1., 1., 1., 1.],[1., 1., 1., 1.],[1., 1., 1., 1.],[1., 1., 1., 1.]],[[1., 1., 1., 1.],[1., 1., 1., 1.],[1., 1., 1., 1.],[1., 1., 1., 1.]]],[[[2., 2., 2., 2.],[2., 2., 2., 2.],[2., 2., 2., 2.],[2., 2., 2., 2.]],[[2., 2., 2., 2.],[2., 2., 2., 2.],[2., 2., 2., 2.],[2., 2., 2., 2.]],[[2., 2., 2., 2.],[2., 2., 2., 2.],[2., 2., 2., 2.],[2., 2., 2., 2.]],[[2., 2., 2., 2.],[2., 2., 2., 2.],[2., 2., 2., 2.],[2., 2., 2., 2.]],[[2., 2., 2., 2.],[2., 2., 2., 2.],[2., 2., 2., 2.],[2., 2., 2., 2.]],[[2., 2., 2., 2.],[2., 2., 2., 2.],[2., 2., 2., 2.],[2., 2., 2., 2.]],[[2., 2., 2., 2.],[2., 2., 2., 2.],[2., 2., 2., 2.],[2., 2., 2., 2.]]],[[[3., 3., 3., 3.],[3., 3., 3., 3.],[3., 3., 3., 3.],[3., 3., 3., 3.]],[[3., 3., 3., 3.],[3., 3., 3., 3.],[3., 3., 3., 3.],[3., 3., 3., 3.]],[[3., 3., 3., 3.],[3., 3., 3., 3.],[3., 3., 3., 3.],[3., 3., 3., 3.]],[[3., 3., 3., 3.],[3., 3., 3., 3.],[3., 3., 3., 3.],[3., 3., 3., 3.]],[[3., 3., 3., 3.],[3., 3., 3., 3.],[3., 3., 3., 3.],[3., 3., 3., 3.]],[[3., 3., 3., 3.],[3., 3., 3., 3.],[3., 3., 3., 3.],[3., 3., 3., 3.]],[[3., 3., 3., 3.],[3., 3., 3., 3.],[3., 3., 3., 3.],[3., 3., 3., 3.]]]]])shape:
torch.Size([1, 3, 7, 4, 4])
"""
print(output, output.shape)"""
tensor([[[[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]],[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]],[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]],[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]],[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]],[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]]],[[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]],[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]],[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]],[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]],[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]],[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]]],[[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]],[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]],[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]],[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]],[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]],[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]]],[[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]],[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]],[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]],[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]],[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]],[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]]],[[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]],[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]],[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]],[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]],[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]],[[48., 48., 48.],[48., 48., 48.],[48., 48., 48.]]]]], grad_fn=<SlowConv3DBackward0>)shape:
torch.Size([1, 5, 6, 3, 3])
"""

48怎么来的?

2x2x2x1 + 2x2x2x2 + 2x2x2x3 = 48

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/659416.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

uni-app - 使用地图功能打包安卓apk的完美流程以及重要的注意事项(带您一次打包成功)

在移动应用开发中&#xff0c;地图功能是一个非常常见且实用的功能&#xff0c;可以帮助用户快速定位并浏览周边信息。而在uni-app开发中&#xff0c;使用地图功能也是一项必备技能。本文将介绍uni-app使用地图功能打包安卓apk的注意事项&#xff0c;帮助开发者顺利完成地图功能…

Linux中ssh登录协议

目录 一.ssh基础 1.ssh协议介绍 2.ssh协议的优点 3.ssh文件位置 二.ssh原理 1.公钥传输原理&#xff08;首次连接&#xff09; 2.ssh加密通讯原理 &#xff08;1&#xff09;对称加密 &#xff08;2&#xff09;非对称加密 3.远程登录 三.服务端的配置 常用的配置项…

QT程序通过GPIB-USB-HS转接线控制数字万用表

1、硬件准备 1.1、数字万用表 型号 &#xff1a;Agilent 34401A 前面图示&#xff1a; 后面图示&#xff1a;有GPIB接口 1.2、GPIB-USB-HS转接线 2、GPIB协议基础了解 2.1、引脚 8条数据线&#xff1a;DIO1 ~ DIO8 5条管理线&#xff1a;IFC、ATN、REN、EOI、SRQ 3条交握线…

“星光不问赶路人,时光不负有心人”

五一假期来临之际&#xff0c;开放签电子签章团队祝大家劳动节快乐&#xff01;愿这个五一小长假带给你轻松愉悦的心情&#xff0c;工作之余享受生活的美好。愿你的每一分努力都有回报&#xff0c;每一个梦想都逐渐实现。休息是为了走更长远的路&#xff0c;愿你假期归来&#…

时序分解 | Matlab实现RLMD鲁棒性局部均值分解

时序分解 | Matlab实现RLMD鲁棒性局部均值分解 目录 时序分解 | Matlab实现RLMD鲁棒性局部均值分解效果一览基本介绍程序设计参考资料 效果一览 基本介绍 Matlab实现RLMD鲁棒性局部均值分解,可直接替换 Matlab语言 1.算法新颖小众&#xff0c;用的人很少&#xff0c;包含分解图…

第11章 SELECT语句和关系代数运算

一、投影与SELECT语句 投射下标&#xff0c;是SELECT查询的列名 二、选择与SELECT语句 下标是 where后限制的条件 三、笛卡尔积与SELECT语句 合并两个关系 四、θ连接与SELECT语句 在笛卡尔积的基础上做选择运算。 五、自然连接与SELECT语句 自然连接结果中包含的列&#x…

最全类型免费SSL证书获取教程

使用SSL证书可以有效地防止数据泄露、身份伪造等网络安全问题。许多初创公司或个人开发者在面对高昂的SSL证书费用时可能会感到头疼。确实&#xff0c;一些知名的SSL证书提供商的证书价格并不低廉&#xff0c;这对于预算有限的小企业和个人来说&#xff0c;无疑构成了一定的经济…

长沙银行2023:深耕县域、扎实零售,双引擎激活增长“向新力”

&#xff08;题图&#xff09; 作者 | 曾响铃 文 | 响铃说 年报披露接近尾声&#xff0c;作为“百业之母”&#xff0c;银行业的“成绩单”自然备受关注。 整体来看&#xff0c;2023年国内经济复苏&#xff0c;企业经营状况持续改善&#xff0c;利好银行资产质量和盈利前景…

基于随机森林和Xgboost对肥胖风险的多类别预测

基于随机森林和Xgboost对肥胖风险的多类别预测 作者&#xff1a;i阿极 作者简介&#xff1a;数据分析领域优质创作者、多项比赛获奖者&#xff1a;博主个人首页 &#x1f60a;&#x1f60a;&#x1f60a;如果觉得文章不错或能帮助到你学习&#xff0c;可以点赞&#x1f44d;收藏…

基于SpringBoot+Vue大学生兼职管理系统的设计与实现

目录 一、前言介绍 二、功能需求 三、功能结构设计 四、管理员功能实现 招聘单位管理 用户管理 论坛管理 公告信息管理 五、招聘单位功能实现 职位招聘管理 职位留言管理 简历投递管理 六、用户功能实现 在线论坛 职位招聘信息 简历投递 简历 七、部分核心代码 …

Ubuntu 24.04 LTS (Noble Numbat) 正式版发布

Ubuntu 24.04 LTS (Noble Numbat) 正式版发布 Canonical 的第 10 个长期支持版本在性能工程、企业安全和开发人员体验方面树立了新标准 请访问原文链接&#xff1a;Ubuntu 24.04 LTS (Noble Numbat) 正式版发布&#xff0c;查看最新版。原创作品&#xff0c;转载请保留出处。…

二、再识VUE-MVVM

一、初识VUE 二、再识VUE-MVVM 三、VUE数据代理 MVVM Vue.js 专注于 MVVM 模型的 ViewModel 层。它通过双向数据绑定把 View 层和 Model 层连接了起来。实际的 DOM 封装和输出格式都被抽象为了 Directives 和 Filters。 ViewModel 一个同步 Model 和 View 的对象。在 Vue.js…