深度学习经典检测算法
two-stage (两阶段) : Faster-rcnn Mask-Rcnn系列 (输入图像---》CNN特征---》预选框---》输出结果)
one-stage (单阶段): YOLO系列 (输入图像---》CNN特征---》输出结果)
one-stage的特点:(1)最核心的优势:速度非常快,适合做实时检测任务(2)缺点:效果通常情况不会太好
two-stage的特点:(1)速度通常慢(5FPS),但是效果通常是不错的(2)非常实用的通用框架Mask-Rcnn
yolo系列:指标分析: (1)map指标:综合衡量检测效果;但看精度和recall不行的,因为这两个有点相斥
(2)IOU :真实值和预测值之间的关系。预测值和真实值。IOU就是交集和并集之间的指标
MAP值
首先算精度:Precision 和召回率 Recall
Precision =TP/(TP+FP)
Recall=TP/(TP+FN)
TP:True Positives 正类判定为正类
FP:False Positives 负类判定为正类,存伪
FN:False negatives 正类判定为负类,“去真”
TN:true negatives 负类判定为负类
例子:
已知条件:班级总人数为100人,其中男生80人,女生20人
目标:找出所有的女生
结果:从班级中选择50人,其中20人是女生,还错误的把30名男生挑选出来了
TP=20,FP=30;FN=0;TN=50
基于置信度阈值来计算Precision 和召回率
MAP就是所有类别的平均
yolo-v1 把检测问题转换为回归问题,一个CNN就搞定了。可以对视频进行实时检测
MAP值和FPS。yolo系列从16年开始,并开始火了
NMS(非极大值抑制)
损失函数
堆叠小的卷积核所需的参数更少一些,并且卷积过程越多,特征提取也会越细,加入的非线性变换也随着增多,还不会增大权重参数个数,这就是VGG网络的基本出发点,用小的卷积核来完成体特征提取操作。