桥介数物 面经(强化学习工程师)
1.详细介绍一下项目
2.状态空间,动作空间,奖励函数怎么设计?
3.为什么状态空间要设计连续三帧的历史信息,有什么好处?
4.在实物系统中遇到的问题,怎么解决sim to real,cuda加速点云处理是怎么实现的?
5.对激光雷达和深度相机的看法,在sim to real 方面。
6.PPO的损失函数是怎么设计的?参数是怎么设计的?优化器用的是什么?
7.八股:python的容器,线程和进程的区别。
8.反问公司的具体业务。
1.详细介绍一下项目
2.状态空间,动作空间,奖励函数怎么设计?
3.为什么状态空间要设计连续三帧的历史信息,有什么好处?
4.在实物系统中遇到的问题,怎么解决sim to real,cuda加速点云处理是怎么实现的?
5.对激光雷达和深度相机的看法,在sim to real 方面。
6.PPO的损失函数是怎么设计的?参数是怎么设计的?优化器用的是什么?
7.八股:python的容器,线程和进程的区别。
8.反问公司的具体业务。
相关推荐