特征金字塔网络(Feature Pyramid Networks,简称FPN)是一种深度学习领域中用于目标检测的重要技术,它解决了在不同尺度上检测物体的挑战。FPN通过融合不同尺度的特征信息,提高模型在不同尺度下的性能表现,从而提高目标检测的准确率、语义分割的完整性和行为识别的可靠性。FPN的核心思想是在不同尺度下对目标进行检测和识别,它采用了自上而下(top-down)和横向连接(lateral connections)的方式,将不同尺度下的特征图进行融合,避免了传统目标检测算法中输入图像经过一系列卷积操作后输出的特征图尺寸逐渐减小,导致高分辨率的特征信息丢失的问题。
FPN利用深度卷积神经网络固有的多尺度金字塔结构来以极小的计算量构建特征金字塔的网络结构。这是一种具有侧向连接的自上而下的网络结构,用来构建不同尺寸的具有高级语义信息的特征图。FPN通过构造一种独特的特征金字塔来避免图像金字塔中计算量过高的问题,同时能够较好地处理目标检测中的多尺度变化问题,效果能够达到当时的SOTA(State of The Art)。
FPN的预测是在不同特征层独立进行的,即同时利用低层特征高分辨率和高层特征的高语义信息,通过融合这些不同层的特征达到预测的效果。作者认为足够低层高分辨率的特征对于检测小物体是很有帮助的。
FPN在目标检测、语义分割、行为识别等领域都有着广泛的应用。通过融合不同尺度的特征信息,FPN能够提高模型在不同尺度下的性能表现。在实际应用中,可以根据具体任务的需求选择适合的特征金字塔网络构建方式,并注意数据集的质量、模型的复杂度以及训练过程中的超参数调整等问题
虽然可以融合不同分辨率和不同类型特征的每个特征层信息;但在降采样和特征融合后,会丢失高分辨率特征信息的部分信息,LIU S 等人[15]提出了底部向上的路径增强方法,利用特征金字塔结构减少向上和向下传播中信息丢失的程度,并通过低维特征图的横向传播,保留对象的更多浅轮廓信息。笔者所使用的路径增强特征金字塔