一文看懂BEV感知中的前中后融合技术方案
专注分享自动驾驶赛道技术干货内容,行业资讯,实习和秋招准备思路及算法岗求职面经
目前,基于纯视觉的感知算法由于造价成本低、感知性能好受到了来自工业界和学术界的广泛关注,很多基于纯视觉的感知算法被设计出来,并且成功部署上车。
但纯视觉的感知方案在恶劣天气情况下性能急剧下降,同时图像天然的深度信息丢失缺陷,促使了多传感器融合策略变得愈发重要。
所以,本文就来梳理一下BEV感知中的前、中、后融合技术方案。
一、前融合
前融合也称之为数据级融合,指将各个传感器采集到的数据先进行时间和空间维度上的同步,实现对原始的多模态数据的直接融合。
✅优点:对传感器数据进行早期融合,更好实现不同模态数据间的关联性。
❎缺点:算力要求高,且需要复杂的融合策略,业内应用不多。
二、中融合
中融合也称之为特征级融合,指将各个传感器采集到的数据通过各自的主干网络进行模态特征的提取,再对提取后的多模态特征进行融合。
✅优点:对提取到的多模态特征进行融合,算力消耗少,数据损失也少,更具性价比。
❎缺点:一定程度上也存在多模态特征不对齐问题,但实现了精度和算力需求的平衡,目前业内主流技术思路。
三、后融合
后融合也称之为目标级融合,指将各个传感器采集到的数据单独进行算法模型推理得到检测结果,最后将各个模态的推理结果进行融合。
✅优点:各个传感器独立预测,解耦性好,各个传感器互为冗余备份。
❎缺点:后处理逻辑复杂,非常依赖人工,无法实现端到端检测,目前业内也都在不断的进行轻后处理的过程。
以上就是BEV感知中前中后融合技术分享的全部内容,如果对你有所帮助,欢迎关注、点赞、收藏、转发!
四、推荐阅读(点击链接即可阅读)
从实验室到开放道路: 自动驾驶必经的"开环和闭环的魔鬼双考"是什么?
从建图王者到幕后标定:一个15年SLAM老兵眼中的行业消亡史