Swin_transformer模型解析

目录

•1、网络整体框架

•2 、Patch Merging

•3 、W-MSA

MSA模块计算量

W-MSA模块计算量

•4、 SW-MSA

•5 、Relative Position Bias


1、网络整体框架

 

2 Patch Merging

这里看着挺复杂,其实就相当于先对特征图进行LayerNorm,然后再进行一个卷积核大小为2×2,步距为2的深度可分离卷积。 

3 W-MSA

MSA模块计算量

W-MSA模块计算量

4 SW-MSA

采用W-MSA模块时,只会在每个窗口内进行自注意力计算,所以窗口与窗口之间是无法进行信息传递的。为了解决这个问题,作者引入了SW-MSA模块,即进行偏移的W-MSA。可以理解成窗口从左上角分别向右侧和下方各偏移了M/2 

可以发现通过将窗口进行偏移后,由原来的4个窗口变成9个窗口了。后面又要对每个窗口内部进行MSA,为了避免进行太多的窗口多头自注意力

 为了防止不同窗口之间的信息乱窜,在实际计算中使用的是masked MSA即带蒙板mask的MSA,这样就能够通过设置蒙板来隔绝不同区域的信息。

5 Relative Position Bias

这里描述的是相对位置索引,也就是相对位置关系,并不是相对位置偏置参数。可以根据相对位置索引去获取对应的参数。关键是怎么根据位置索引获取相对位置偏置参数? 

为了方便把二维索引转成一维索引。但如果将行标和列表直接简单相加会出现问题。比如相对位置索引中有(0 , -1)和(-1 , 0) 在二维的相对位置索引中明显是代表不同的位置,但如果简单相加都等于-1那就出问题了。

 

这样每个位置就得到了自己唯一的相对位置索引 

我们可以创建一个可训练的相对位置偏置列表,在列表之找到对应的相对位置偏置。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/589472.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

webapi 允许跨域

1.在Nuget安装webapi.cors 添加完会有这个包 然后在项目App_Start 目录下的WebApiConfig.cs里面添加 // Web API 配置和服务// 添加跨域设置config.EnableCors(new EnableCorsAttribute("*", "*", "*"));

CSS基础选择器 小案例复习(画三个小盒子)

(大家好,前面我们学习了基础的选择器,俗话说:温故而知新。所以今天我们将通过小案例来复习前面学过的小知识点。另,十分感谢大家对我文章的支持❤️) 通过这个案例复习两个地方: 类选择器的使用…

GICv3学习

中断分组 GICD_CTLR:配置是否支持group0、安全group1、非安全group1中断; 怎么配置中断在哪个组; 怎么知道中断是安全的还是非安全的; GICD_IGROUPR: 配置中断分组、中断是安全还是非安全; 4.4 软件产生中…

北方经贸经济类知网收录月刊投稿发表论文

《北方经贸》期刊是由国家新闻出版总署批准,黑龙江省教育厅主管,黑龙江省经济管理干部学院主办的经济类综合期刊。期刊融理论性、知识性、实践性于一体,立足龙江,辐射全国,面向世界,注重研究解决重大现实理…

探索智慧物流园区系统的发展蓝图

在当今数字化时代,智慧物流园区系统正经历着深刻的变革和快速的发展。那么,智慧物流园区系统的发展趋势究竟是什么呢?让我们一同深入探讨。 (1)智能化是智慧物流园区系统的重要发展趋势之一。通过人工智能、大数据等先…

双机 Cartogtapher 建图文件配置

双机cartogtapher建图 最近在做硕士毕设的最后一个实验,其中涉及到多机建图,经过调研最终采用cartographer建图算法,其中配置多机建图的文件有些麻烦,特此博客以记录 非常感谢我的同门 ”叶少“ 山上的稻草人-CSDN博客的帮助&am…

文心一言指令词宝典之旅行篇

作者:哈哥撩编程(视频号、抖音、公众号同名) 新星计划全栈领域优秀创作者博客专家全国博客之星第四名超级个体COC上海社区主理人特约讲师谷歌亚马逊演讲嘉宾科技博主极星会首批签约作者 🏆 推荐专栏: 🏅…

【C++】理解vector的底层原理并模拟实现(手撕vector)

目录 01.成员变量 02.构造与析构 03.管理内存 1.reserve函数 2.reszie函数 04.访问元素 05.修改元素 之前的一篇博客讲到了vector的介绍及其运用:vector的介绍及使用说明 但是我们不仅要会用,还要理解它的底层原理,今天我们通过手撕一个…

wireshark解析grpc/protobuf的方法

1,wireshark需要安装3.20以上 下载地址:https://www.wireshark.org/ 2,如果版本不对,需要卸载,卸载方法: sudo rm -rf /Applications/Wireshark.app sudo rm -rf $HOME/.config/wireshark sudo rm -rf /…

设计模式-结构型-享元模式Flyweight

享元模式的特点: 享元模式可以共享相同的对象,避免创建过多的对象实例,从而节省内存资源 使用场景: 常用于需要创建大量相似的对象的情况 享元接口类 public interface Flyweight { void operate(String extrinsicState); } 享…

报错 | 2023新版IDEA/PyCharm连接远程服务器的Docker需使用密钥认证

文章目录 01 问题情景02 需求场景及工作原理03 解决步骤3.1 在本地生成密钥对3.2 将公钥保存至服务器3.3 本地连接时选择私钥文件 网上有很多文章讲怎么解决,但都要么写得很复杂,要么没有写明白原理或操作详情,造成我一头雾水。 01 问题情景…

一维卷积神经网络的特征可视化

随着以深度学习为代表的人工智能技术的不断发展,许多具有重要意义的深度学习模型和算法被开发出来,应用于计算机视觉、自然语言处理、语音处理、生物医疗、金融应用等众多行业领域。深度学习先进的数据挖掘、训练和分析能力来源于深度神经网络的海量模型…