已注销

2019-12-05 08:52 已编辑

关注

目标检测论文解读9——R-FCN

背景

　　基于ResNet 101的Faster RCNN速度很慢，本文通过提出Position-sensitive score maps(位置敏感分值图)来给模型加速。

方法

　　首先分析一下，为什么基于ResNet 101的Faster R-CNN很慢？

　　其实主要的原因是ROI Pooling层后面的Conv5无法共享计算，每一个RoI都要计算一次，一次检测RoI可能有几百个，计算量巨大。

　　我们已经知道Conv层的作用是提取特征，那为什么不跟把Conv5放到RoI Pooling前面，让RoI映射到Conv5输出的feature map呢？

　　这是因为Conv5会使feature map进一步压缩，w*h变小，feature map小了，位置敏感性显然会降低，从而检测的结果不准。

　　于是，作者提出了一种兼顾速度和准度的结构。

　　观察上面的模型，我们可以看到，在RoI pooling层后面用来提取特征的Conv层都放到前面了，所以共享了计算，速度加快。

　　同时，作者提出一种Position-sensitive score maps的方法来解决位置信息丢失，大致是这样的。

　　原图片经过一系列的Conv层，输出一个channel为k*k*(C+1)的feature map，k=3,代表一张图片的九宫格各位置，C为类别数。可以看到feature map的每一个点，都是k*k*(C+1)-d的feature vector，其中包含了这个点在某位置且为某类的得分信息。

　　RPN提出的RoI，映射到feature map中，也被分为k*k个bin。

　　接下来，进行一次Position-sensitive RoI pooling(位置敏感池化)操作。步骤如下：找到一个左上角的bin，然后找到他所对应的(C+1)-d的类别得分信息，可以对w*h的bin的类别信息进行平均池化，得到一个(C+1)的类别信息；其他8个位置也按照同样步骤。

　　经过这一步，就能得到一个k*k*(C+1)的feature map，再对k*k个(C+1)的vector平均一次(论文用的方法)，得到(C+1)的vector，softmax返回一个概率最大的类别就行了。

总结

　　可以看到，之所以作者的方法之所以位置精度高，主要是因为他把问题从给一个RoI分类转变成了给一个RoI的九个位置分类，从而提高了位置敏感度。

全部评论

推荐最新楼层

11-19 14:53

腾讯云智研发_视觉算法工程师(准入职员工)

腾讯云智内推腾讯云智面经

面了差不多27分钟自我介绍面试一开始，面试官打开了摄像头，但由于网络问题，我提到面试官说话有点卡，随后他就关闭了摄像头。谈谈你对C++、Go语言和Java语言的理解面试官让我谈谈对这三种编程语言的理解，我主要讲了指针、内存回收等方面的内容。谈谈你对HTTPS的理解这个问题主要考察我对网络安全协议的了解。进程与线程的区别面试官让我解释进程和线程的区别。你实习项目说一下我详细介绍了自己在实习期间参与的项目。你的博客项目是你自己做的一个博客项目吗？我如实回答，项目是跟着网上教程做的，但我自己扩展了一些功能，比如实现了线程池。Java垃圾回收机制面试官让我解释Java的垃圾回收机制。反问环节面试官表示...

点赞评论收藏

11-20 10:52

牛客运营

中国烟草薪资待遇，这给的太多了吧？！

烟草的薪资架构：基本工资+绩效工资+年终奖+奖金+节日福利据调查显示，高待遇岗位、沿海的部分烟厂到手月薪1w+，年薪15w+，甚至年薪达到20w+的岗位也不在少数。还有六险二金、单身宿舍、住房补贴、电话补贴、定期体检、购物卡、过节费等。*不过不同地区福利待遇会有所不同哦。如此福利满满的中国烟草，我们该怎么做好求职准备呢？1/ 报名：烟草一般都会将招考信息发布在官网，信息中有详细的招聘时间、报考渠道、考试内容等信息。2/ 笔试：中国烟草的笔试和公务员考试相似，包含行测、申论、公基等，不同地区的笔试考察侧重点不同，比如部分地区会要求《烟草专业知识》等。3/ 面试：烟草面试分为结...

国央企薪资爆料

点赞评论收藏

11-11 19:29

华中科技大学嵌入式软件工程师

以前真的是被华子打包带走啊 形势变太快了

joe2333：怀念以前大家拿华为当保底的日子

点赞评论收藏

11-18 23:01

已编辑

华中科技大学 C++

算能科技音视频日常实习面经

不是很复杂，20min自我介绍，聊天：为什么想来北京，你不是在上海吗？来过北京吗？对音视频有兴趣吗？如何看待目前实习的这份工作？等等问题：yuv420相比rgb节省多少空间？或者说同样像素yuv的大小和rgb大小的关系？音画同步靠什么？音画不同步的情况？如果视频比音频慢了？对于拉流有了解吗？（不了解，目前主要了解的是，拉流后，从读取开始的这部分的音视频技术）h264？linux用过吗？隔一天后hr通知通过，谈入职，急着让我去，但我得15天后才入职。等待offer审核ing，不知道会不会因为入职时间收不到offer。发出来面经就当作攒人品啦~

查看12道真题和解析

点赞评论收藏

点赞收藏评论

全站热榜

正在热议

# 选完offer后，你后悔学本专业吗 #

# 985本硕1个中小厂offer，摆烂or继续努力 #