桥介数物 面经(强化学习工程师)

1.详细介绍一下项目

2.状态空间,动作空间,奖励函数怎么设计?

3.为什么状态空间要设计连续三帧的历史信息,有什么好处?

4.在实物系统中遇到的问题,怎么解决sim to real,cuda加速点云处理是怎么实现的?

5.对激光雷达和深度相机的看法,在sim to real 方面。

6.PPO的损失函数是怎么设计的?参数是怎么设计的?优化器用的是什么?

7.八股:python的容器,线程和进程的区别。

8.反问公司的具体业务。

全部评论
这公司我也看到了,说是就10个人😂
点赞 回复 分享
发布于 昨天 14:18 江苏
大佬觉得这个公司怎么样?
点赞 回复 分享
发布于 昨天 14:18 湖北

相关推荐

1 1 评论
分享
牛客网
牛客企业服务