Yolo系列算法-理论部分-YOLOv3

0. 写在前面

        YOLO系列博客,紧接上一篇Yolo系列算法-理论部分-YOLOv2-CSDN博客

1. YOLOv3-定型之作

        2018年,Redmon团队推出YOLOv3的网络模型,将骨干网络(backbone)由darknet-19替换成darknet-53网络,加入特征金字塔网络结构,解决多尺度检测的问题,在分类模块中使用逻辑回归代替了softmax,在兼顾实时性的基础上还保证目标检测的准确性。

        同时作者也提供了轻量级tiny-darknet,YOLO系列开始走向工程化的路线,轻量化的模型让目标检测算法在计算性能弱一些的芯片中运行成为了可能。

2. 网络结构

        YOLOv3的骨干网络有了较大的升级,将ResNet残差网络思想,将darknet-19改进为darknet-53;卷积层主要使用1×1和3×3的卷积核,每个卷积层之后都会加上批量归一化和Leaky ReLU(主要是为了防止过拟合)。卷积层、批量归一化层以及Leaky ReLU共同组成darknet-53中的基本卷积单元DBL,其中包含53个DBL,网络结构细节如下图所示。

        说明:

  1.  DBL:Conv(卷积)+BN(批量归一化)+LeakyReLU组成基本卷积单元
  2. res unit:输入通过两个DBL后,再与原输入进行add,常规的残差单元,目的是为了让网络可以提取更深层的特征,同时避免出现梯度消失或爆炸;
  3. resn:n表示n个res unit,所以resn = Zero Padding + DBL + n × res unit;
  4. concat:将darknet-53的中间层和后面的某一层的上采样进行张量拼接,达到多尺度特征融合的目的。这与残差层的add操作不一样,拼接会扩充张量的维度,而add直接相加不改变张量维度
  5. Y1、Y2、Y3:分别表示YOLOv3三种尺度的输出。

        改进

  1. 没有采用最大池化层,转而采用步长为2的卷积层进行下采样;
  2. 为了防止过拟合,在每个卷积层之后加入BN+Leaky ReLU
  3. 引入残差网络的思想,让网络可以提取深层的特征,同时避免出现梯度消失或爆炸;
  4. 网络的中间层和后面某一层的上采样进行张量拼接,实现多尺度特征融合的功能
3. 核心提升详解
        1. 多尺度Anchors

        YOLOv3选择三种不同shape的Anchors,同时每种Anchors具有三种不同的尺度,一共9种不同大小的Anchors,(10×13)、(16×30)、(33×23)、(30×61)、(62×45)、(59×119)、(116×90)、(156×198)、(373×326)。

        借助特征金字塔的思想,三种不同尺度的网络输出Y1、Y2和Y3,目的是预测不同尺度的目标,由于在每一个尺度网格都负责预测3个边界框,且COCO数据集有80个类,所以网络输出的张量应该是:N×N×[3 × (4 + 1 + 80)]。由下采样次数不同,得到的N不同,最终Y1、Y2和Y3的shape分别为:[13,13,255]、[26,26,255]和[52,52,255]

        2.损失函数

        损失函数中,位置损失部分并没有改变,置信度损失和类别预测损失改为了交叉熵的损失计算方法

        3. 多标签分类

        将YOLOv2网络结构中用于分类的softmax层修改为逻辑分类器,v2中算法认定一个目标只会从属于一个类别,根据网络输出类别得分最大值,将其归为某一类。然而在一些复杂场景中,单一目标可能从属于多个类别。

        例如,在交通场景中,目标既是汽车又是卡车,单标签分类的方法就满足不了要求。

        逻辑分类器是对每一个类别都进行二分类,使用sigmoid函数,将其约束到0-1,如果某一个特征图输出经过该函数处理后的值大于设定的阈值,那么就认定目标框所对应的目标属于该类。

4. 性能表现

        YOLOv3在COCO数据集上测试结果,在满足检测精度差不多的情况下,有着更快的推理速度。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/539995.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

精品基于Uniapp+ssm模拟考试系统小程序考试试题试卷

《[含文档PPT源码等]精品微信小程序基于Uniappssm模拟考试系统小程序》该项目含有源码、文档、PPT、配套开发软件、软件安装教程、项目发布教程、包运行成功! 软件开发环境及开发工具: 开发语言:Java 后台框架:ssm 安卓框架&a…

守护健康,从营养开始 —— 帕金森患者的饮食秘籍

亲爱的读者朋友们,您是否知道,在对抗帕金森病的道路上,正确的饮食和营养补充可以成为我们的有力盟友?今天,就让我们一起探索那些能够帮助帕金森患者改善症状、提高生活质量的营养素,开启健康生活的新篇章。…

《父母的觉醒》父母不是在培养一个“迷你版”的自己

简介 作者为美国哥伦比亚大学心理学博士沙法丽萨巴瑞。作者也写了《家庭的觉醒》。 作者的核心观点: 我们必须认识到,我们不是在培养一个“迷你版”的自己,而是在塑造一个具有独立特征的灵魂。正因为如此,我们必须铆足精神&#…

ETH共识升级之路

简介 根据我们之前的介绍,了解到ETH网络的共识方式,已经从 PoW 切换到了 PoS,今天我们就回顾下升级之路,以及升级带来的影响 最早的共识机制 PoW 以太坊创建之初采用了类似比特币的工作量证明机制,即矿工通过计算哈希函…

JAVA实战开源项目:计算机机房作业管理系统(Vue+SpringBoot)

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 登录注册模块2.2 课程管理模块2.3 课时管理模块2.4 学生作业模块 三、系统设计3.1 用例设计3.2 数据库设计3.2.1 课程表3.2.2 课时表3.2.3 学生作业表 四、系统展示五、核心代码5.1 查询课程数据5.2 新增课时5.3 提交作…

【消息队列开发】 实现消息删除逻辑

文章目录 🍃前言🌲实现步骤🚩检验参数的合法性🚩读取Message数据🚩二进制转为message🚩isValid 设置为无效🚩写入文件🚩更新统计文件🚩特别注意🚩完整代码 ⭕…

运动想象 (MI) 迁移学习系列 (9) : 数据对齐(EA)

运动想象迁移学习系列:数据对齐(EA) 0. 引言1. 迁移学习算法流程2. 欧式对齐算法流程3. 与RA算法进行对比4. 实验结果对比5. 总结欢迎来稿 论文地址:https://ieeexplore.ieee.org/abstract/document/8701679 论文题目:Transfer Le…

【论文阅读】MoCoGAN: Decomposing Motion and Content for Video Generation

MoCoGAN: Decomposing Motion and Content for Video Generation 引用: Tulyakov S, Liu M Y, Yang X, et al. Mocogan: Decomposing motion and content for video generation[C]//Proceedings of the IEEE conference on computer vision and pattern recognitio…

vscode-server的搭建方法

一、配置服务器端口支持 1、开放端口: 2、关闭防火墙 systemctl stop firewalld.service systemctl disable firewalld.service二、配置code-server到服务器上** 1、下载code-server-4.22.0-linux-amd64.tar.gz到本地(可下载最新的版本)&a…

几何相互作用GNN预测3D-PLA

预测PLA是药物发现中的核心问题。最近的进展显示了将ML应用于PLA预测的巨大潜力。然而,它们大多忽略了复合物的3D结构和蛋白质与配体之间的物理相互作用,而这对于理解结合机制至关重要。作者提出了一种结合3D结构和物理相互作用的几何相互作用图神经网络GIGN,用于预测蛋白质…

CV论文--2024.3.15

1、FastMAC: Stochastic Spectral Sampling of Correspondence Graph 中文标题:FastMAC: 随机谱采样对应关系图 简介:在计算机视觉中,3D对应关系是指一对3D点,构成了基本概念。一组具有兼容边的3D对应关系形成了对应关系图&#…

openssh漏洞升级版本9.4.1p

服务器在做漏扫时发现openssh有几个高危漏洞,现在需要将openssh版本升级到9.4p1 查看openssh版本号 ssh -V 环境准备下载相关依赖和命令 yum install wget gcc openssl-devel pam-devel rpm-build zlib-devel -y 现有openssl1.0.2k升级openssl到1.1.1t 下载安装包 w…