摘要

在这项工作中,我们开发了一种替代的迭代方案,其中在每次迭代中都检测到一个新的对象子集。来自先前迭代的检测到的框在接下来的迭代中传递到网络,以确保不会两次检测到同一对象。只需对训练和推理过程进行较小的修改,就可以将这种迭代方案应用于一级和二级对象检测器。

问题描述

现代的NMS之类的算法无法处理拥挤的环境,会把拥挤的两个对象看成一个对象。

所做工作

对象检测器可以分为两类:

  • 两级检测器(R-CNN系列)
  • 一级检测器 (YOCO)
    • 更高的速度,接近两级检测器的精度
    • 最近Anchor-free的算法出现了

原先的NMS算法的缺陷:

  • 选择得分较高的检测的特性,导致了NMS在拥挤环境会出问题

做出的努力:

  • NMS的聚类问题
  • NMS重新定制为积分任务
  • Soft-NMS的应用
  • Fitness-NMS和Soft-NMS的结合
  • 自适应NMS
  • R2NMS同时预测对象的完整框和可见框
  • 加循环LSTM层,用于通过Hungarian loss function训练序列生成
  • 将Jaccard指数估计为检测质量得分的层,以及一个新颖的EM合并单元

该算法:

迭代进行检测:

  • 第一次先搜索一些比较简单的对象
  • 之后几次慢慢增加抑制参数并提高精度

检验算法可行度

  • 使用AdaptIS Toy V1 and Toy V2数据集
  • 基于MMDetection框架
  • SGD optimizer with momentum 0.9, weight decay parameter 0.0001, and initial learning rate 0.02
  • Adam lr = 0.0001

Reference

[1] D. Rukhovich, K. Sofiiuk, D. Galeev, O. Barinova, and A. Konushin, “IterDet: Iterative Scheme for ObjectDetection in Crowded Environments,” 2020, [Online]. Available: http://arxiv.org/abs/2005.05708.