强化学习工程师面试经验

1.介绍项目

2.用的什么算法(PPO)

3.强化学习与监督学习的一个区别(这里没答好)

4.状态空间动作空间奖励函数的设计

5.对抗决策为什么没用多智能体强化学习 6.时序差分是什么?贝尔曼方程是什么? 7.面试官介绍公司,问家在哪,为什么选择西安。 8.HR问是否有其他offer,开了多少工资,为什么选择考国防科大

全部评论
佬,哪个公司
点赞 回复 分享
发布于 2024-09-30 21:35 湖北
xd请问是西安的哪个公司呢
点赞 回复 分享
发布于 2024-10-22 17:12 北京

相关推荐

程序员鼠鼠_春招版:我要12k吧我挂了,还招呢,天天被割,这点钱都不舍得出
点赞 评论 收藏
分享
评论
2
6
分享

创作者周榜

更多
牛客网
牛客企业服务