自动驾驶领域里,BEV和Occupancy分别指的是什么?
BEV是Bird's Eye View的缩写,即鸟瞰视图。在自动驾驶方面,BEV表示从车辆上方俯瞰的场景视图。BEV图像能呈现车辆周边环境的完整视图,像车辆的前、后、两侧以及顶部都包含在内。
BEV图像有多种生成方式,例如:
特斯拉在自动驾驶里运用了一种深度学习方法——Occupancy Network。这是一种3D语义占用感知法,能从多视图图像生成车辆周边环境的三维占用网格。
Occupancy Network的工作原理是这样的。

具体而言,Occupancy Network在自动驾驶系统里主要承担以下任务:
未来,自动驾驶技术持续发展,Occupancy Network在自动驾驶系统里会起到更重要的作用。
BEV和Occupancy工程该怎么学习?
首先要有扎实的基础知识。
学习BEV和OCC必须要有扎实的知识根基,像线性代数、微积分、概率论、深度学习、计算机视觉等知识是必不可少的,还要掌握ubuntu操作系统、C++、python、pytorch、矩阵论,并且要有阅读论文和博客的习惯。
其次为数据采集与处理能力。
BEV与OCC的算法训练和验证都离不开大量数据,所以数据采集与处理能力不可或缺。数据采集可借助激光雷达、摄像头、毫米波雷达等传感器实现,而数据处理则要对数据清洗、标注和增强等,以保证数据质量与可用性。
在数据采集与处理上,得掌握传感器原理、数据采集、数据集框架制定、数据增强等技能。开源数据集通用性和适用性多有限,所以要依据自身工程需求进行定制开发。
其三为算法开发能力。
BEV与OCC算法要能从数据里提取2D和3D的有效特征,解耦特征头,融合多种数据特征,处理时序信息,且开展有效建模与推理。算法开发要有扎实的数学、统计、机器学习基础,还得具备一定编程能力。
其四为模型的扩展能力。
这是最为关键的一点,要举一反三,参考前沿方向并结合现有资料,提出有挑战性的话题。借助车道线、时序信息、三维重建、slam定位等技术提升模型性能。