NAS-FPN

NAS-FPN: Learning Scalable Feature Pyramid Architecture for Object Detection

Method

利用神经结构搜索和强化学习给定搜索空间训练一个控制器来选择最好的模型结构,接下来主要是设计搜索空间,本次使用的baseline都是retinanet。

Architecture Search Space

Feature Pyramid Network

特征金字塔的结构形式和一般的形式没有太多的区别

Merging cell

一个FPN包含了N个merging cell,而决定如何构建merging cell的一个RNN控制器(实际程序中实际上是没有RNN的,程序结构已经是RNN训练好的结构),该控制器选择任意两个候选特征图和一个二元操作相结合来生成一个新的特征图,每一个merging cell都有四个不同的预测步骤通过不同的softmax分类器。

1、选择一个候选特征图

2、选择另外一个候选特征图

3、选择输出的候选特征图的尺寸

4、选择一个二元操作,结合两个特征图到指定的分辨率(求和,globalpool)

5、新产生的特征图添加到候选区域中,并且为了减少运算量,在3的时候不选分辨率最大的特征图

Deeply supervised Anytime Object Detection

使用堆叠金字塔网络扩展NAS-FPN的一个优点是可以在任何给定金字塔网络的输出中获得特征金字塔表示。该网络可以随时检测,生成检测结果并提前退出。