简称NMS。。。 故事背景 在object detection中,任务一般有两个方面: 首先要找到物体的大概位置(如图所示的框框,bounding box,简写为bbox) 然后分析这框框里是个啥物体(分类 class) 但是实际上我们可能找到好些框框,其实圈住的大概是同一个物体,这样的情况下其实保留一个最好的框框就够了。 算法 理念很简单呐,以左边的一只狗为例 首先呢,蓝色框框和橘色框框的重叠区域过大,证明他们其实很可能指的是同一只狗 那么就选出最有可能是这只狗的框的bbox。其余的统统丢弃。 那么问题来了: 重叠区域怎么算?专业术语交并比,Intersection over ...