深度视觉目标跟踪进展综述

1    引言

目标跟踪旨在基于初始帧中指定的感兴趣目标( 一般用矩形框表示) ,在后续帧中对该目标进行持续的定位。

基于深度学习的跟踪算法,采用的框架包括相关滤波器、分类式网络、双路网络等。

处理跟踪任务的角度,分为基于匹配思路的双路网络和基于二分类的辨别式跟踪器。

最初的深度跟踪算法聚焦于相关滤波器,通过深度学习的特征+相关滤波器实现。

基于双路网络跟踪算法那,将跟踪视为模板匹配,抗干扰能力较差。

近期基于Transformer的深度跟踪器使用注意力机制,取得了领先的性能。

2    跟踪数据集发展趋势

数据、算法和算力是人工智能最重要的三个要素,是人工智能的三个基石。

3    深度跟踪算法

3.1    深度相关滤波器跟踪

相关滤波器( correlation filter,CF) 通过学习一个具有区分力的滤波器来处理待跟踪的图片,其输出结果为一个响应图,表示目标在后续帧中不同位置的置信度.

在早期的工作中,研究人员探索如何将离线训练好的深度特征(如利用ImageNet预训练的 VGG模型)与相关滤波器进行结合。本质就是将HOG等手工特征替换成神经网络提取的特征。

深度学习提取特征的特点是,高层的语义特征对于目标的抽象表达能力很强,而低层的模型特征擅长刻画目标的纹理、形状等底层信息.

HCF算法的示意图,融合了不同层次的深度特征。

得益于相关滤波器的闭合解,研究人员尝试将滤波器和深度特征提取网络进行联合训练,等于是深度特征从离线获取升级到联合训练。

CFNet算法的架构,就是采用联合训练的模式。

3.2    基于分类的深度跟踪器

基于分类的深度跟踪方法受经典的目标检测框架R-CNN的启发,将目标跟踪任务视为二分类( 目标和背景) 任务。

对每个视频,分别训练独立的分类层(最后一个全连接层)用于区分当前视频域中的目标和干扰物.

3.3双路网络跟踪算法

双路网络框架(SiamFC),此方法利用卷积网络提取目标模板和搜索区域的特征,然后再进性相关操作生成响应图,其中响应图上的峰值点就是目标所在的位置。

在此之后,考虑到SiamFC对目标尺度的回归仍然采用传统缩放形式不能准确地获得目标的尺度信息。

SiamRPN ++解决了边界填充问题,也使用了多层次特征融合的方法。

尽管以上的双路网络方法在视频目标跟踪中取得了很大的成功,但是仍然存在缺陷,缺少在线更新过程.MemTrack、Meta-Tracker、Re2EMA、UpdateNet和GradNet等, 提出了不同的模板更新算法。

3.4基于梯度优化的深度跟踪方法

CREST的该卷积核和搜索图片的特征图进行卷积,可以生成响应图用于目标跟踪,有点模版匹配的味道。

3.5基于Transformer的深度跟踪方法

Transformer的核心模块是注意力机制,可以将全局信息聚合到需要的位置.

4展望

如何设计适合他们的轻量级模型,例如使用神经网络搜索的方式来获得更优的模型结构,以兼顾低内存消耗和高精度具有重要的研究价值。总之就是平衡精度与模型复杂度之间矛盾。

5结论

虽然深度学习算法取得了令人瞩目的成绩,但与此同时带来的跟踪效率限制和模型存储消耗等问题仍需进一步完善.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/229617.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

RFID资产管理系统全功能详解!高效管理从这里开始!

在现代商业环境中,RFID资产管理系统正成为企业管理不可或缺的先进工具。现代企业管理正处于数字化的浪潮中,而RFID资产管理系统正是这场浪潮中的一颗璀璨明珠。在这篇文章中,我们将全方位解析RFID资产管理系统的功能,助您深入了解…

分析:为什么有些pdf打开之后无法编辑?

pdf文件大家应该都经常接触,但是不知道大家会遇到这种情况:有些PDF文件打开之后无法编辑?是什么原因呢?今天我们来分析一下都是那些原因导致的。 首先我们可以考虑一下,PDF文件中的内容是否是图片,如果确认…

Linux——vim编辑文件时——.swp文件解决方案

test.cpp样例 当我们vim test.cpp进入编辑文件。 却忘记了保存退出 再次进入就会出现一下画面 当你摁下Enter键位 出现以下几个选项 O——是只读不写 E——是正常打开文件但不会载入磁盘内容 R——覆盖——是加载存储磁盘的文件(当我们忘记保存时,系统会自动帮我…

网络入门---网络的大致了解

目录标题 网络发展的简单认识协议作用的理解协议的本质什么是协议分层网络通信所面对的问题OSI七层模型TCP/IP模型协议报头的理解局域网通信局域网通信基本原理报头的问题局域网的特点跨网的网络链接如何查看mac地址 网络发展的简单认识 通过之前的学习我们知道计算机是给人提…

基于STM32单片机的智能家居系统设计(论文+源码)

1.系统设计 基于STM32单片机的智能家居系统设计与实现的具体任务: (1)可以实现风扇、窗帘、空调、灯光的开关控制; (2)具有语音识别功能,可以通过语音控制家电; (3&a…

JS:获取当前日期是本年度的第几周

问题 根据当前的日期(比如年月日),来得到当前日期属于本年度的第几周 解决 代码: // 获取当前日期是本年的第几周 //参数: a为年 b为月 c为日 function getYearWeek(a, b, c) {var date1 new Date(a, parseInt(b)…

[C++]:9: string类的模拟实现

string类的模拟实现 0:类的成员变量:一.构造析构赋值:1.构造:2.析构:3.赋值: 二.容量相关:1.size()2.capacity()3.reserve()4.clear()5.empty() 三.c_str和operator[]1.c_str2.operator[] 四.pu…

进入最后倒计时!就在深圳福田明天上午9点正式开幕!不容错过!

会展中心介绍 深圳会展中心交通快捷便利,南邻滨河快速干道,与口岸、港口及高速公路相连,驾车驱往深圳火车站仅需15分钟、深圳机场仅需30分钟。地铁1号、4号线在会展中心站接驳,通过市政地下通道可从馆内直达地铁站,仅需…

【MATLAB】RLMD分解+FFT+HHT组合算法

有意向获取代码,请转文末观看代码获取方式~也可转原文链接获取~ 1 基本定义 RLMD分解FFTHHT组合算法是一种强大的分析方法,结合了局部均值分解(LMD)、快速傅里叶变换(FFT)和希尔伯特-黄变换(H…

5W2H分析法

5W2H分析法 5W2H分析法又叫七问分析法。 模型介绍 简单、方便,易于操作的思考(框架)模型,问题分析模型,它可以帮助我们保证思考的严谨与全面,也能给人启发,有着广泛的应用: 提问-可…

MySQL索引使用总结

索引(index) 官方定义:一种提高MySQL查询效率的数据结构 优点:加快查询速度 缺点: 1.维护索引需要消耗数据库资源 2.索引需要占用磁盘空间 3.增删改的时候会影响性能 索引分类 索引和数据库表的存储引擎有关,不同的存储引擎&am…

探索Python内置类属性__repr__:展示对象的魅力与实用性

概要 在Python中,每个对象都有一个内置的__repr__属性,它提供了对象的字符串表示形式。这个特殊的属性在调试、日志记录和交互式会话等场景中非常有用。本文将详细介绍__repr__属性的使用教程,包括定义、常见应用场景和注意事项,…