2019-12-05 08:54 已编辑

关注

目标检测论文解读2——Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

背景

　　用ConvNet方法解决图像分类、检测问题成为热潮，但这些方法都需要先把图片resize到固定的w*h，再丢进网络里，图片经过resize可能会丢失一些信息。论文作者发明了SPP pooling(空间金字塔池化)层，让网络可以接受任意size的输入。并且用在目标检测任务上，可以只计算一次整图的feature map，再找到region proposal的feature map在原图上的映射，最后进行SPP pooling。

方法

　　(1)首先思考一个问题，为什么ConvNet需要一个固定size的图片作为输入，我们知道，Conv层只需要channel固定(彩色图片3，灰度图1），但可以接受任意w*h的输入，当然输出的w*h也会跟着变化；然而，后面的FC层却需要固定长度的vector作为输入，图片size变化->conv层输出的size变化->FC层输入的vector长度变化，这就产生了错误。

　　怎么解决这个问题呢？作者给出的方法是在最后一层Conv层后面加上一个SPP pooling层，SPP pooling层可以将接收到的不同size的输入转换成为固定的输出，保证FC层的输入长度固定。

　　

　　如图，SPP pooling层的原理很简单，例子如下：给定一个w*h的特征图，把其分别分成4*4、2*2、1*1的bin，在每个bin上面作pooling操作(文中使用的是max pooling)，最后能得到16*256-d(256-d是最后一个conv层的输出通道数)，4*256-d、1*256-d的feature vector，最后连接在一起，得到的就是21*256-d的feature vector。

　　可以看到，不管一开始的w和h取值多少，最后都能得到固定长度的feature vector作为FC层的输入，这样，ConvNet就能接受不同size的图片作为输入了。

　　(2)此外，SPP NET还在RCNN上面作出了共享计算的改进。

　　RCNN的流程是：先求出一张图片的几千张子图，再送到网络中训练。这样会对很多子图重合的部分进行了冗余计算。

　　SPP NET的流程如下：先直接让一张图片通过CNN层，得到feature map，再找到几千张子图在原图的映射，直接得到对应的feature map，再利用SPP pooling层将其转换为固定长度的vector，再用FC层分类，最后进行边框回归修正位置。

总结

　　论文作者通过在FC层前面加上一个SPP pooling层，有效解决了ConvNet必须接受固定size的图片。并且只计算一次整张图的feature map，避免了大量的冗余计算。

缺点

　　SPP NET的缺点在于它的训练过程中，前面的CNN层的参数是不会变化的，用的还是R-CNN的参数。

全部评论

推荐最新楼层

不愿透露姓名的神秘牛友

07-03 16:16

美团暑期实习跑路怎么和组里说比较好？

当初也不知道怎么脑子进水拒了慢脚，没挨过毒打真以为开水团是白说的，不过好在主播高强度偷偷面试，现在拿了别家大厂offer，业务和语言都是自己更喜欢的，两边转正估计都差不多但是现在该怎么和mentor还有领导说我要跑路这件事呢，说实话还是编个理由？以后会不会被拉黑啊

俺不是程序猿ovo：扯毕设导师让回去做实验

投递美团等公司9个岗位

点赞评论收藏

分享

07-02 22:20

三环集团_机电研发部_自动化应用研发(准入职员工)

路原理方面简述基尔霍夫定律的内容，并说明其在电路分析中的应用。什么是叠加定理？如何运用叠加定理计算复杂电路中的电流和电压？电机学方面直流电机和交流电机在结构和工作原理上有哪些主要区别？简述三相异步电机的启动方式及其特点。自动控制原理方面解释什么是 PID 控制，说明 P、I、D 三个参数对控制系统性能的影响。什么是系统的稳定性？如何判断一个控制系统是否稳定？请详细介绍你在学校或实习期间参与过的与机电相关的项目，包括项目背景、目标、你的职责以及最终成果。在项目实施过程中，你遇到过哪些技术难题？是如何解决的？有没有在团队项目中与他人产生意见分歧的情况？你是如何处理的？用英语介绍一下你自己或你的专业...

点赞评论收藏

分享

06-03 16:55

广州工商学院单片机

各位大佬，这个简历找实习都拒绝了，哪里有问题还是说哪里可以加强修改

见见123：简历没有啥问题，是这个社会有问题。因为你刚毕业，没有工作经历，现在企业都不要没有工作经历的。社会病了。

点赞评论收藏

分享

05-21 00:25

电子科技大学后端

26java求拷打

简历求拷打😭😭现在投暑期感觉太晚了，也怪楼主太拖沓😡😡

lllllkin：感觉可以精简到一页简历，有些排版感觉不是必须的。时间线越早的，你自己越熟悉的放前面。描述可以更精简些，一些问题解决感觉可以不用写具体技术栈，卖个关子，等面试官问。

点赞评论收藏

分享

07-03 17:38

门头沟学院业务管理

谢谢所有释放善意的hr

码农索隆：这种hr，建议全中国推广

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 实习生的蛐蛐区 #

10541次浏览 94人参与

# 社会教会你的第一课 #

5346次浏览 97人参与

# 现代汽车前瞻技术研发急速编程挑战赛 #

41107次浏览 292人参与

# 应届生，你找到工作了吗 #

7961次浏览 74人参与

# 神州信息工作体验 #

12921次浏览 63人参与

# 简历当中有水分算不算造假？ #

8585次浏览 92人参与

# 说说你知道的学历厂 #

5510次浏览 49人参与

# 你认为小厂实习有用吗？ #

2405次浏览 38人参与

# 歌尔求职进展汇总 #

55161次浏览 335人参与

# 被AI治愈的瞬间 #

56600次浏览 619人参与

# 双非应该如何逆袭？ #

178855次浏览 3111人参与

# 秋招盘点:机械人值得去的企业 #

73267次浏览 671人参与

# 毕业旅行去哪玩儿 #

9544次浏览 130人参与

# 三一集团提前批进度交流 #

23763次浏览 139人参与

# 没有合适的工作，你会先找个干着，还是考公考研 #

117470次浏览 1134人参与

# 哪一瞬间觉得自己长大了 #

938次浏览 34人参与

# 非技术岗投递进展 #

145901次浏览 1264人参与

# 数字马力求职进展汇总 #

180191次浏览 1489人参与

# 材料进Fab厂真的劝退吗？ #

44657次浏览 184人参与

# 春招进度记录 #

346034次浏览 3386人参与

# 下班后的时间你怎么安排 #

880次浏览 20人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务