ATSS

Bridging the Gap Between Anchor-based and Anchor-free Detection via Adaptive Training Sample Selection

Introduction

作者指出anchor based(retinanet)和center based(FCOS)中有几个不同的地方:

  • 每个位置平铺的锚点数量。 RetinaNet 在每个位置平铺多个锚框,而 FCOS 在每个位置平铺一个锚点
  • 正负样本的定义,retinanet使用了IoU来判断正负,而FCOS则利用了空间和尺度约束来选择样本
  • 回归的开始状态,RetinaNer从预设的锚框回归出物体的边界框,而FCOS从锚点开始定位物体

从实验结果中可以总结出来,正是正负样本定义的差异,导致了最终的性能差异。

本篇论文的贡献:

  • 介绍anchor based和center based的最主要的差异是正负样本定义的不同
  • 提出了一个自适应的选择正负样本的方法(ATSS)
  • 通过实验证明了铺设多个anchor其实没什么用

Method

ATSS可以自动的分配正负样本,并且不需要额外的参数只需要一个k。

第3-6行,在每个层级选择中心点距离gt最近的k各anchors,得到k*L个,之后计算这些anchor的IoU,利用IoU计算均值和方差,将两个结果相加得到阈值,最后IoU大于该阈值的样本为正样本,否则为负样本。

通过均值加标准差更加能够筛选出哪些层级的anchor该被分配为正样本。

实际上在代码实现中,还需要判断所筛选出来的anchor中心是否落在了GT中。