【计算机视觉 | CNN】Image Model Blocks的常见算法介绍合集(四)

文章目录

    • 一、Dilated Bottleneck with Projection Block
    • 二、NVAE Generative Residual Cell
    • 三、NVAE Encoder Residual Cell
    • 四、Bottleneck Transformer Block
    • 五、Spatial Feature Transform
    • 六、Big-Little Module
    • 七、Scale Aggregation Block
    • 八、Multiscale Dilated Convolution Block
    • 九、XCiT Layer
    • 十、Local Patch Interaction
    • 十一、MLP-Mixer Layer
    • 十二、Style-based Recalibration Module
    • 十三、Two-Way Dense Layer
    • 十四、SqueezeNeXt Block
    • 十五、Extremely Efficient Spatial Pyramid of Depth-wise Dilated Separable Convolutions
    • 十六、CSPResNeXt Block
    • 十七、Elastic Dense Block
    • 十八、DVD-GAN GBlock
    • 十九、DVD-GAN DBlock
    • 二十、Local Relation Network

一、Dilated Bottleneck with Projection Block

Dilated Bottleneck with Projection Block 是 DetNet 卷积神经网络架构中使用的图像模型块。 它采用带有扩张卷积的瓶颈结构来有效地扩大感受野。 它使用 1x1 卷积来确保空间大小保持固定。

在这里插入图片描述

二、NVAE Generative Residual Cell

NVAE 生成残差单元是一个跳跃连接块,用作生成器 NVAE 架构的一部分。 残存细胞扩大通道数E应用深度可分离卷积之前的时间,然后将其映射回C渠道。 设计动机是通过增加网络的感受野来帮助对数据中的远程相关性进行建模,这解释了扩展路径,同时也解释了使用深度卷积来控制参数计数。

在这里插入图片描述

三、NVAE Encoder Residual Cell

NVAE 编码器残差单元是编码器 NVAE 架构中使用的残差连接块。 它应用了两个系列的 BN-Swish-Conv 层,而不改变通道数。

在这里插入图片描述

四、Bottleneck Transformer Block

Bottleneck Transformer Block 是 Bottleneck Transformer 中使用的块,它用多头自注意力 (MHSA) 替换残差块中的空间 3 × 3 卷积层。

在这里插入图片描述

五、Spatial Feature Transform

在这里插入图片描述
在这里插入图片描述

六、Big-Little Module

Big-Little 模块是具有两个分支的图像模型块:每个分支代表一个来自深度模型的单独块和一个不太深的对应块。 它们被提议作为 BigLittle-Net 架构的一部分。 这两个分支通过线性组合和单位权重融合。 这两个分支被称为大分支(低分辨率下更多层和通道)和小分支(高分辨率下更少层和通道)。

在这里插入图片描述

七、Scale Aggregation Block

在这里插入图片描述
在这里插入图片描述

八、Multiscale Dilated Convolution Block

多尺度扩张卷积块是一种 Inception 风格的卷积块,其动机是图像特征自然地出现在多个尺度上,网络的表达能力与它可以表示的函数范围除以参数总数成正比,再除以 希望有效地扩展网络的感受野。 多尺度扩张卷积 (MDC) 块应用单个 F × F F \times F F×F在多个扩张因子下进行过滤,然后对每个扩张过滤器的输出执行加权元素求和,从而允许网络以最小的参数增加同时学习一组特征以及这些特征出现的相关尺度。 这也快速扩展了网络的感受野,而无需增加深度或参数数量。

在这里插入图片描述

九、XCiT Layer

XCiT 层是 XCiT 架构的主要构建块,它使用交叉协方差注意算子作为其主要操作。 XCiT 层由三个主要块组成,每个块前面都有 LayerNorm,后面跟着一个残差连接:(i) 核心交叉协方差注意 (XCA) 操作,(ii) 局部补丁交互 (LPI) 模块,以及 (iii) 前馈网络(FFN)。 通过转置查询-键交互,XCA 的计算复杂度与数据元素的数量 N 呈线性关系,而不是像传统的自注意力机制那样呈二次方关系。

在这里插入图片描述

十、Local Patch Interaction

本地补丁交互(LPI)是一个用于 XCiT 层的模块,用于实现补丁之间的显式通信。 LPI 由两个深度方向的 3×3 卷积层组成,其间具有 Batch Normalization 和 GELU 非线性。 由于其深度结构,LPI 块在参数方面的开销可以忽略不计,并且在推理期间的吞吐量和内存使用方面的开销也有限。

在这里插入图片描述

十一、MLP-Mixer Layer

Mixer 层是 Tolstikhin 等人提出的 MLP-Mixer 架构中使用的层。 al (2021) 用于计算机视觉。 混合器层纯粹由 MLP 组成,没有卷积或注意力。 它接受嵌入图像块(令牌)的输入,其输出与其输入具有相同的形状,类似于 Vision Transformer 编码器。 正如其名称所示,Mixer 层通过其包含该层的“令牌混合”和“通道混合”MLP 来“混合”令牌和通道。 它利用了其他架构先前的技术,例如层归一化、跳跃连接和正则化方法。

在这里插入图片描述

十二、Style-based Recalibration Module

基于风格的重新校准模块 (SRM) 是一个用于卷积神经网络的模块,它通过利用中间特征图的风格来自适应地重新校准中间特征图。 SRM首先通过风格池化从特征图的每个通道中提取风格信息,然后通过与通道无关的风格集成来估计每个通道的重新校准权重。 通过将个体风格的相对重要性纳入特征图中,SRM 旨在增强 CNN 的表示能力。

SRM的整体结构如右图所示。 它由两个主要组件组成:样式池和样式集成。 风格池算子通过总结跨空间维度的特征响应来从每个通道提取风格特征。 接下来是风格集成运算符,它通过通道操作利用风格特征来生成特定于示例的风格权重。 样式权重最终重新校准特征图以强调或抑制其信息。

在这里插入图片描述

十三、Two-Way Dense Layer

双向密集层是 PeleeNet 架构中使用的图像模型块。 受 GoogLeNet 的启发,使用 2 路密集层来获得不同尺度的感受野。 该层的一种方式使用 3x3 内核大小。 该层的另一种方式使用两个堆叠的 3x3 卷积来学习大型物体的视觉模式。

在这里插入图片描述

十四、SqueezeNeXt Block

SqueezeNeXt 块是 SqueezeNeXt 架构中使用的两级瓶颈模块,用于减少 3 × 3 卷积的输入通道数。 我们用可分离卷积进行分解,以进一步减少参数数量(橙色部分),然后是 1 × 1 扩展模块。

在这里插入图片描述

十五、Extremely Efficient Spatial Pyramid of Depth-wise Dilated Separable Convolutions

EESP 单元(即深度方向扩张可分离卷积的极其高效空间金字塔)是专为边缘设备设计的图像模型块。 它被提议作为 ESPNetv2 CNN 架构的一部分。

该构建块基于减少-拆分-转换-合并策略。 EESP 单元首先使用分组逐点卷积将高维输入特征图投影到低维空间,然后使用具有不同扩张率的深度扩张可分离卷积并行学习表示。 每个分支中不同的扩张率允许 EESP 单元从大的有效感受野中学习表示。 为了消除扩张卷积引起的网格伪影,EESP 使用分层特征融合 (HFF) 来融合特征图。

在这里插入图片描述

十六、CSPResNeXt Block

CSPResNeXt Block 是一个扩展的 ResNext Block,我们将基础层的特征图划分为两部分,然后通过跨阶段层次结构将它们合并。 使用拆分和合并策略允许更多的梯度流通过网络。

在这里插入图片描述

十七、Elastic Dense Block

弹性密集块是一个跳过连接块,它通过在每一层的并行分支中进行下采样和上采样来修改密集块,以便让网络从数据缩放策略中学习,其中输入在每层中以不同的分辨率进行处理。 之所以称为“弹性”,是因为网络中的每一层都可以通过软策略灵活选择最佳规模。

在这里插入图片描述

十八、DVD-GAN GBlock

DVD-GAN GBlock 是 DVD-GAN 架构中用于视频生成的生成器的残差块。

在这里插入图片描述

十九、DVD-GAN DBlock

DVD-GAN DBlock 是 DVD-GAN 架构中用于视频生成的鉴别器的残差块。 与常规残差块不同,由于应用于视频中的多个帧,因此采用 3D 卷积。

在这里插入图片描述

二十、Local Relation Network

局部关系网络(LR-Net)是一个用局部关系层构建的网络,代表特征图像提取器。 该特征提取器根据局部像素对的组成关系自适应地确定聚合权重。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/110206.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

恒运资本:证券交易费用?

跟着股市越来越成为大众投资的挑选,对证券买卖费用的了解越来越受到关注。证券买卖费用是指投资者在进行证券买卖过程中需要付出的各种费用,这些费用直接影响到投资收益。本文将从多个视点剖析证券买卖费用。 1. 佣钱 佣钱是证券买卖中最基本的费用&…

字节一面:说说var、let、const之间的区别

前言 最近博主在字节面试中遇到这样一个面试题,这个问题也是前端面试的高频问题,作为一名前端开发工程师,熟练掌握js是我们的必备技能,var、let、const之间的区别我们也得熟练掌握,博主在这给大家细细道来。 &#x1f…

Java入坑之语法糖

一、for和for-each 1.1for和for-each概念 for 循环是一种常用的循环结构,它可以通过一个变量(通常是 i)来控制循环的次数和范围。for 循环的语法格式如下: for (初始化; 布尔表达式; 更新) {//代码语句 }for-each 循环是 Java …

北邮22级信通院数电:Verilog-FPGA(1)实验一“跑通第一个例程” 过程中遇到的常见问题与解决方案汇总(持续更新中)

北邮22信通一枚~ 跟随课程进度更新北邮信通院数字系统设计的笔记、代码和文章 持续关注作者 迎接数电实验学习~ 获取更多文章,请访问专栏: 北邮22级信通院数电实验_青山如墨雨如画的博客-CSDN博客 目录 问题一:Verilog代码没有跑通 报…

【数据结构】二叉树链式结构的实现(三)

目录 一,二叉树的链式结构 二,二叉链的接口实现 1,二叉链的创建 2,接口函数 3,动态创立新结点 4,创建二叉树 5,前序遍历 6,中序遍历 7,后序遍历 三,结点个…

Mojo 语言官网

Mojo面向 AI 开发者的新型编程语言,无缝支持CPU、GPU,兼容Python,跟Python类似的语法,但是比Python快68000倍。目前Mojo仅支持Ubuntu,暂不支持Windows和Mac,可以在Mojo Playground先体验一下。 Mojo 语言…

【LeetCode-简单题KMP】459. 重复的子字符串

文章目录 题目方法一:移动匹配方法二:KMP算法 题目 方法一:移动匹配 class Solution {//移动匹配public boolean repeatedSubstringPattern(String s) {StringBuffer str new StringBuffer(s);//ababstr.append(s);//拼接一份自己 abababab…

day44:C++ day4,拷贝赋值、友元、常成员、运算符重载

一、仿照string类&#xff0c;完成myString 类 mystring.h #ifndef MYSTRING_H #define MYSTRING_H#include <iostream> #include <cstring>using namespace std;class myString { private:char *str; //记录c风格的字符串int size; //记录字…

北大C++课后记录:文件读写的I/O流

前言 文件和平常用到的cin、cout流其实是一回事&#xff0c;可以将文件看作一个有限字符构成的顺序字符流&#xff0c;基于此&#xff0c;也可以像cin、cout读键盘数据那样对文件进行读写。 读写指针 输入流的read指针 输出流的write指针 注&#xff1a;这里的指针并不是普…

使用scp命令失败出错

使用scp命令失败出错&#xff0c;无反应。 解决&#xff1a; 1.使用ifconfig查看目标主机公网IP地址 ifconfig需使用公网ip 2.配置免密登录 可参考 远程登录ssh ssh-copy-id root目标主机ip再次尝试scp命令。 SCP&#xff08;Secure Copy&#xff09;是一个用于在本地主机和…

uni-app:通过ECharts实现数据可视化-如何引入项目

效果 引入文件位置 代码 <template><view id"myChart"></view> </template> <script> import echarts from /static/js/echarts.js // 引入文件 export default {mounted() {// 初始化EChartsconst myChart echarts.init(document…

RabbitMQ消息可靠性(一)-- 生产者消息确认

前言 在项目中&#xff0c;引入了RabbitMQ这一中间件&#xff0c;必然也需要在业务中增加对数据安全性的一层考虑&#xff0c;来保证RabbitMQ消息的可靠性&#xff0c;否则一个个消息丢失可能导致整个业务的数据出现不一致等问题&#xff0c;对系统带来巨大的影响&#xff0c;…