NAS-FPN

NAS-FPN: Learning Scalable Feature Pyramid Architecture for Object Detection Method 利用神经结构搜索和强化学习给定搜索空间训练一个控制器来选择最好的模型结构,接下来主要是设计搜索空间,本次使用的baseline都是retinanet。 Architecture Search Space Feature Pyrami

ORConv

Oriented Response Networks Introduction 本篇论文的贡献有以下几点: Oriented Response Networks 在卷积过程中旋转卷积核的方式来提取图片不同方向的特征,并且使用ARF后ORN需要的啊网络参数明显减少,并且支持明确的分层方向信息的编码 Active Rotating Filters 需要学习的只有标准的卷积核,其余卷积核的参数根据标准卷

Transformer

Attention is all you need Model Architecture Encoder and decoder stacks Encoder:在本篇论文中编码层设置了6层,每一层都有两个子网络,第一个multi-head self-attention mechanism第二个是简单的position-wise 全连接前向网络,并且在每一个子网络中都引入了残差结构之后再接上一个la