【机器学习】卷积神经网络(五)-计算机视觉应用

七、应用-计算机视觉

7.1 人脸检测

DenseBox\Femaleness-Net\MT-CNN\Cascade CNN 介绍

09d80934883241c4303e322fcc08c146.png

7d8b5e305f2b67ef827b5226787d2602.png

VJ框架的分类器级联用于卷积网络

8d8118f9e262ccbbb34a7b1cc8d08b71.png

用于人脸检测的紧凑卷积神经网络级联

问题:作者希望实时检测高分辨率视频流中的正面,由于人脸图像和背景的多样性和复杂性,这具有挑战性。

解决方案:作者提出了三个卷积神经网络 (CNN) 的级联,其参数很少,并且可以在移动 GPU 上高效运行。

结果:作者表明,他们的 CNN 级联可以以高达每秒 27 帧的速度处理 4K 超高清视频,并在 FDDB 数据集上实现与最先进的正面人脸检测器相当的性能。他们还声称他们的检测器比任何现有的 CPU 或 GPU 算法都要快得多2。

本文提出了一种基于三个紧凑 CNN 级联的正面人脸检测新解决方案34。第 1 部分的要点是:

动机:作者的目标是设计一种快速、准确的检测器,可以处理高分辨率视频流,并应对人脸图像和背景的巨大变化和困难。

方法:作者使用三个参数很少的 CNN,并针对低级并行性和速度对其进行了优化。第一个 CNN 扫描图像金字塔并拒绝大部分背景区域5。第二个和第三个 CNN 使用选择单元对剩余区域进行分类和细化。最终的检测是通过非极大值抑制算法获得的。

评估:作者将他们的检测器与 FDDB 数据集上的其他正面和多视角人脸检测器进行了比较,结果表明他们的检测器具有相似的性能,但速度要高得多。他们还展示了他们的探测器可以在移动 GPU 上实时处理 4K 超高清视频,并且对图像内容具有鲁棒性。

这篇论文提出了一种基于卷积神经网络(CNN)的级联人脸检测器,它具有以下几个特点:

  • 它只有三个级联阶段,比其他的级联方法更简洁。

  • 它使用了紧凑的CNN结构,减少了特征图的数量,但保证了模型的准确性。

  • 它可以异步地执行不同的级联阶段,提高了检测的速度和效率。

  • 它利用了SIMD、CUDA和OpenCL等技术,对CNN的实现进行了优化,使得检测器的性能接近硬件的峰值。

这篇论文在两个公开的人脸检测数据集上进行了实验,证明了它的优越性。它可以在移动平台上实时地处理4K超高清视频流。

5ccd91bf8320c7c86174cd05ee94fba2.png

Compact Convolutional Neural Network Cascade for Face Detection

https://arxiv.org/ftp/arxiv/papers/1508/1508.01292.pdf  Compact Convolutional Neural Network Cascade for Face Detection

https://github.com/Bkmz21/CompactCNNCascade Bkmz21/CompactCNNCascade:一个二进制库,用于使用紧凑型 CNN 进行非常快速的人脸检测。(github.com)

51c25b0f32a32facf72ac5dbdf8e1d83.png

DenseBox目标检测

d74b7a9c2297fdae747d66a60ea800f2.png

3b614896c43f9549e8cab6aea5386e2b.png

b0bfc9485d9ac3afed28fbf0cde744f7.png

网络结构

https://zhuanlan.zhihu.com/p/44021975 人脸检测之DenseBox - 知乎 (zhihu.com)

https://arxiv.org/abs/1509.04874 

Faceness-Net 人脸检测

adcb118a362368b667ce043244010118.png

97f4f4fab1cd3a5b456175bf55007e00.png

b0b10fe3493c73b56d5884cf59e1a7d8.png

https://ar5iv.labs.arxiv.org/html/1701.08393?_immersive_translate_auto_translate=1 Faceness-Net: Face Detection through Deep Facial Part Responses --- [1701.08393] Faceness-Net:通过深层面部部分响应进行人脸检测 (arxiv.org)

MT-CNN(Multi-Task CNN,多任务CNN)

cedc9ca78c9a88e9b7c90e84e28a9c71.png

71c63af3b2e49a8c3695f8e91f5110a4.png

https://github.com/timesler/facenet-pytorch 预训练的 Pytorch 人脸检测 (MTCNN) 和人脸识别 (InceptionResnet) 模型

https://github.com/YYuanAnyVision/mxnet_mtcnn_face_detection  MTCNN人脸检测,下载mxnet_mtcnn_face_detection的源码

7.2 通用目标检测

12947c03d3e4bb62b862b099a8673a5c.png

deformable parts model 介绍

585ed87d99b95de0f956d20593263b53.png

 IOU概念介绍

6a93a55d9e910b4c902581d2873be38f.png

通用目标检测的R-CNN算法

dae3f964a7fbe639ceb6c83983eb1c0c.png

35830bed2736af70dfc52ea5018a98b2.png

4f3d4b987576b17333c4884ea5881081.png

8bad28653697d7c9f6ae188624a4448a.png

https://en.wikipedia.org/wiki/Region_Based_Convolutional_Neural_Networks

https://neurohive.io/en/popular-networks/r-cnn/

空间金字塔池化(Spatial Pyramid Pooling,简称SPP)网络

09951d6002d7bbcb506de5a4712e5475.png

a0c4e2dc63b3f5e075b6c9a1407aff72.png

9ac720bfea3fd84ed60c36dffd1b61dd.jpeg

https://www.mdpi.com/2079-9292/9/6/889 Evaluation of Robust Spatial Pyramid Pooling Based on Convolutional Neural Network for Traffic Sign Recognition System (mdpi.com)

SPP网络与R-CNN网络对比

6d804085a351457085f36bcf9d50acdf.png

介绍Fast R-CNN 网络

eade2c8e230f54bbcbce430e6a85d008.png

56a87f1d0314c53c55a6eb1acc1cac20.png

897c796d8eeafdc7756a87da624f4392.png

3b51c82f341e918350843e3b36406b04.png

Fast R-CNN - arXiv.org. https://arxiv.org/abs/1504.08083.

https://github.com/rbgirshick/fast-rcnn

详述R-CNN,SPP,Fast R-CNN的优缺点

ff0f936ce10735bd1e143d3b49835b59.png

c9d5365a7599150b8d241542860b1478.png

e53c19039e8b13b5af3bb78a7d567778.png

ROI池化层

e825a4e4dbe5b6197a2e742ca0b052e5.png

2f84c7bc3c68492b1ce2cc83a666b068.png

Faster R-CNN

819f2e756343f2a287511970f2647607.png

f881fc9322d7eadf8cf6d6e9a9955041.png

https://zhuanlan.zhihu.com/p/370407951 一文详解R-CNN、Fast R-CNN、Faster R-CNN - 知乎 (zhihu.com)

Faster R-CNN相比于之前的R-CNN版本有哪些优点和不足?

fc29ae47ef48aa794de8a8c65dcb40ac.png

Mask R-CNN

2ae1394d1e960b3dff0fa3f5290fb714.png

9dc74db9f491df72a5b7e01cdbae5fc1.png

https://arxiv.org/abs/1703.06870 [1703.06870] Mask R-CNN (arxiv.org)

https://zhuanlan.zhihu.com/p/462521226 Mask R-CNN超详细介绍 - 知乎 (zhihu.com)

Yolo 网络

4807571c31f2dcfe886957a4b860b377.png

aaa2a07ef8f0a56bd90b5c48f8ae8d77.png

e9d0e30ce240e0eb00b5f3b9c9645b32.png

https://github.com/ultralytics/yolov5

https://zhuanlan.zhihu.com/p/186014243

YOLO相较于R-CNN系列算法有哪些不同之处?

814fb45f85630bd63e040f10772e810e.png

SSD网络

0b2b557ce194dc8839153e9787103d5a.png

SSD网络结构

4e1ff76907a47ba65ab8099ad5f9ec9e.png

d202c4f6adfa924fe4ae6d772743faf6.png

SSD网络主要用于哪些任务?

fb40269c9fd008bdda0f51d2d326017a.png

SSD网络是如何生成候选检测框的?

892bf75265dbb82e2c3293c4a427d119.png

SSD网络的训练算法

6bd5da1792e041178b15808fcff0fd4e.png

https://arxiv.org/abs/1512.02325

https://arxiv.org/pdf/1512.02325.pdf

Smooth L1损失

0846ea78be31c16250287ae40c9a9b55.png

88accce43907e0dc6092b3b99989f4b2.png

https://zhuanlan.zhihu.com/p/267688490 目标检测回归损失函数——L1、L2、smooth L1 - 知乎 (zhihu.com)

7.3 人脸关键点定位

c0f8bd9d9c836c976fdf18678c0d3370.png

a5dfe42bebc9386416826999ee0ef118.png

参考网址:

https://aravamu2-cs-766-project-webpage.netlify.app/r-cnn/

https://zhuanlan.zhihu.com/p/172121380

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/322036.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

5.云原生之DevOps和CICD

文章目录 怎么理解DevOps?所需环境介绍创建devops java项目DockerFile文件Jenkinsfiledevops.yaml文件 搭建 DevOps 项目创建凭证创建devops项目创建流水线编写流线文件运行流线 为流水线设置电子邮箱服务器设置QQ邮箱 SMTP服务器配置jenkins邮箱服务器 使用Webhook…

【KingbaseES】实现MySql函数WEERDAY

CREATE OR REPLACE FUNCTION weekday(date_val date) RETURNS integer AS $$ BEGIN RETURN EXTRACT(ISODOW FROM date_val); END; $$ LANGUAGE plpgsql IMMUTABLE;

自制数据库空洞率清理工具-C版-02-EasyClean-V1.1(支持南大通用数据库Gbase8a)

一、环境信息 名称值CPUIntel(R) Core(TM) i5-1035G1 CPU 1.00GHz操作系统CentOS Linux release 7.9.2009 (Core)内存3G逻辑核数2Gbase8a版本8.6.2-R43.34.27468a27EasyClean版本V1.1 二、简述 工作和兴趣相结合的产物,既能更好的完成工作,也能看看自…

分布式【zookeeper面试题23连问】

1. ZooKeeper是什么? ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,它是集群的管理者,监视着集群中各个节点的状态根据节点提交的反馈进行下一步合理操作。最终&#x…

windows机器上安装mysql

0、mysql下载地址 1、参考文章 2、把Data数据目录迁移到其他盘 2.0 首先停止mysql(任务管理器-详细信息-随便找个进程右击进入转入服务,找到MySQL服务,点击停止) 2.1 windows的 mysql默认的data目录在C:\ProgramData\MySQL\MySQ…

Vue知识总结-上

VUE初识 Vue是一套用于构建用户界面的渐进式(由只需要轻量小巧的核心库构建的简单应用逐渐扩展为可以引入各式各样的Vue组件构建的复杂应用)JavaScript框架 Vue需掌握的内容:Vue基础、Vue-cli、vue-router、vuex、element-ui、vue3 Vue特点 采用组件化模式、提高代…

element-ui组件DatePicker日期选择器移动端兼容

element-ui组件DatePicker日期选择器移动端兼容 css /** 移动端展示 **/ media screen and (max-width: 500px) {.el-picker-panel__sidebar {width: 100%;}.el-picker-panel {width: 400px!important;}.el-picker-panel__content {width: 100%;}.el-picker-panel__body{marg…

C++-模板与容器

1、模板 模板可以让类或者函数支持一种通用类型,这种通用类型在实际运行过程中可以使用任何数据类型。因此程序员可以写出一些与类型无关的代码。这种编程方式也叫“泛型编程”。 通常有两种形式: 函数模板类模板 1.1 函数模板 //模板类型声明 template&…

Mac M1 Parallels CentOS7.9 Install Parallels Tools

一、挂载parallels-tools安装包 mkdir /media/cdrom/ mount /dev/cdrom /media/cdrom/ mount: /dev/sr0 写保护,将以只读方式挂载二、GCC升级 yum install -y centos-release-scl yum install -y devtoolset-8-gcc*# 切换当前会话中gcc版本为8 scl enable devtool…

李沐机器学习系列4---全连接层到卷积

1 从全连接到卷积 1.1 平移不变性 从概率分布的角度来看卷积的定义, f ( τ ) f(\tau) f(τ)是概率密度, g ( t − τ ) g(t-\tau) g(t−τ)是在这个分布下的均值 ( f ∗ g ) ( t ) ∫ − ∞ ∞ f ( τ ) g ( t − τ ) d τ (f*g)(t)\int_{-\infin}^{\infin}f(\t…

vue-打包

打包的作用 说明:vue脚手架只是开发过程中,协助开发的工具,当真正开发完了>脚手架不参与上线 打包的作用: 1)将多个文件压缩合并成一个文件 2)语法降级 3)less sass ts语法解析 打包后…

大创项目推荐 深度学习卫星遥感图像检测与识别 -opencv python 目标检测

文章目录 0 前言1 课题背景2 实现效果3 Yolov5算法4 数据处理和训练5 最后 0 前言 🔥 优质竞赛项目系列,今天要分享的是 🚩 **深度学习卫星遥感图像检测与识别 ** 该项目较为新颖,适合作为竞赛课题方向,学长非常推荐…