【ECCV 2024】智加科技提出统一双向BEV构建的视觉SOTA算法DualBEV

一、论文导读

作者提出了一种同时考虑了双向BEV特征构建流程的视觉3D目标检测算法DualBEV,在nuScenes数据集上实现了55.2%的mAP和63.4%的NDS的SOTA感知结果,超过了现有的单向BEV构建算法BEVDepth、BEVFormer以及双向BEV构建算法FB-BEV,DualBEV的核心思路如下

二、网络模型结构&技术细节梳理

通过整体网络框架图可以看到,DualBEV首先利用图像主干网络提取环视图像的特征,然后利用SceneNet网络预测像素的深度概率以及实例掩码区域,将二者喂入到Prob-LSS分支HeightTrans分支得到LSS特征和HT特征。然后利用提出的Dual Feature Fusion模块得到融合后的特征,进而计算BEV概率分布得到最终的BEV空间特征,再利用3D检测头输出最终的感知结果。

核心创新点一:HeightTrans分支

HeightTrans分支与以往采用3D->2D采样构建BEV特征的思路类似,都是先在BEV空间中显示的生成3D网格点,然后根据坐标投影关系汇聚2D图像特征信息构建最终的BEV特征。但是与通常采用Transformer的方式来构建BEV特征依旧存在一些不同之处。

  • 对BEV的高度方向进行优化:取消Deformable Attention的偏移点采样+高度方向上的均匀3D点设置,改为多分辨率的采样策略;在[-2, 2m]范围内分辨率为0.5m,防止遗漏小尺度的目标特征,其他范围内的分辨率是1m;
  • 对图像特征的采样进行优化:论文作者考虑到3D映射到2D图像上的点有可能会落在背景区域,所采样的特征会干扰模型的检测过程。将前文提到的SceneNet预测的实例Mask作用于特征提取的过程中,用于缓解这类问题;
  • 对3D点的投影过程进行优化:论文作者为了区分多个BEV网格点会对应同一个2D图像位置的情况,将前文提到的SceneNet预测的深度概率用于评估这些映射对应情况;
  • 对BEV特征的生成进行优化:作者为了解决空白BEV网格无法提供任何有用检测信息的问题,在生成BEV特征的过程中引入了BEV概率,此外,作者还引入了BEVPoolv2和查找表来加速BEV特征的构建过程。

核心创新点二:Prob-LSS分支

作者认为深度估计网络对于离散深度预测的固有不确定性会导致BEV空间中存在无关的特征信息,为了解决这一问题,作者在2D->3D的特征构建过程中同样引入了BEV概率。

核心创新点三:Dual Feature Fusion

在通过HeightTrans分支和Prob-LSS分支得到两种不同方式构建的BEV特征之后,作者引入了包含通道注意力和空间注意力的Dual Feature Fusion模块来集成这两种特征,其中通道注意力用于预测两类特征的通道权重,空间注意力用于预测BEV空间概率,Dual Feature Fusion模块的具体网络结构如下。

  • 通道注意力:作者利用Dual Feature Fusion中的CAF模块来获取通道方向上的权重。该融合阶段旨在利用学习通道级的权重从两个特征中实现更好的特征融合。
  • 空间注意力:作者利用Dual Feature Fusion中的SAE-ProbNet模块来得到BEV空间概率,用于缓解空白BEV网格对于模型性能的影响。

三、实验结果

DualBEV在nuScenes数据集上的不同算法实验结果对比和可视化结果汇总

#牛客创作赏金赛##论文##算法##互联网##自动驾驶#

记录一位智驾感知算法工程师的日常读论文笔记(不定期更新~)

全部评论

相关推荐

点赞 评论 收藏
分享
不愿透露姓名的神秘牛友
昨天 18:45
美团 后端 25*15.5 硕士985
点赞 评论 收藏
分享
不愿透露姓名的神秘牛友
11-27 10:18
点赞 评论 收藏
分享
跨域请求是指在浏览器上,通过 JavaScript 在一个域(即网站的域名)上发起的 HTTP 请求,试图访问另一个域上的资源。根据同源策略(Same-Origin Policy),浏览器限制了跨域请求,以防止恶意行为。同源策略要求,协议、域名和端口必须完全一致才能进行跨域请求。为了解决跨域问题,有几种常见的方法:https://www.nowcoder.com/issue/tutorial?zhuanlanId=Mg58Em&uuid=b48bebe08e474db8b80b853b12bafd48JSONP(JSON with Padding): JSONP 是一种利用  标签不受同源策略限制的特性来实现跨域请求的方法。可以通过动态创建  标签来请求跨域脚本,而跨域脚本会包装在一个回调函数中,从而达到获取数据的目的。跨域资源共享(Cross-Origin Resource Sharing,CORS): CORS 是一种在服务器端设置的机制,允许服务器声明哪些跨域请求是被允许的。通过在服务器响应中设置特定的头信息,例如 Access-Control-Allow-Origin,来指定哪些源(域名)被允许跨域访问。代理服务器: 通过设置代理服务器,将跨域请求转发到同一个域中,然后再将响应返回给浏览器。这种方法需要在后端进行配置和处理。WebSocket: 由于 WebSocket 是一种基于消息的双向通信协议,在建立连接时并没有受到跨域限制,因此可以通过 WebSocket 进行跨域通信。选择哪种方法解决跨域问题取决于具体的需求和后端支持的能力。通常情况下,使用 CORS 是最常见和推荐的方法。#ai智能作图#
点赞 评论 收藏
分享
评论
1
1
分享
牛客网
牛客企业服务