启元世界二面——深度强化学习凉经

启元世界二面
自我介绍
实验室项目介绍
MA2C是什么?
在你的项目中,是怎么处理多智能体学习过程中的非平稳问题的?
AC算法和PG算法相比,有什么优势?
在神经网络中,为什么要引入残差结构?
为什么GRU和LSTM相比于RNN能够避免梯度消失问题?
说说off-policy 和 on-policy有什么区别?
ReLu激活函数在0处的导数是多少?ReLu在零点不可导,那么在反向传播中怎么处理?
答:在零点是人为给他赋予一个导数,一般是0或者1,
追问:那给它赋值为2可不可以?为什么?
PPO中,怎么度量两个分布差别到底多大?有哪几种方法去度量?
答:KL散度
追问:那你说说KL散度是怎么计算的?
回答不上来QAQ

撕代码:
题目描述:小Q在游戏中需要守卫一条路线,范围是[0, L], 可认为是一维数轴,现有n个守卫,每个守卫的守护范围是[xi,yi],问小Q至少需要多少个守卫能守护这条路线。
输入:
5 8
0 2
0 7
2 4
4 6
6 9
输出:2#面经##启元世界##校招##算法工程师#
全部评论
请问楼主一面二面间隔了多久呢?
1 回复 分享
发布于 2021-10-25 20:34
楼主一面面经呢?
点赞 回复 分享
发布于 2021-10-09 19:37
兄弟能问下原因吗,是代码撕的太慢了还是?
点赞 回复 分享
发布于 2022-04-28 21:24

相关推荐

01-02 21:17
已编辑
西安理工大学 后端
程序员小白条:项目不太重要,你的优势的算法竞赛,然后多背相关的八股文,项目可以不作为重点考虑,面试可能就简单带过项目就行了,你可以直接写简历,背项目相关的八股文就行,也不用自己做,时间紧张的情况下,性价比最高
点赞 评论 收藏
分享
评论
3
26
分享

创作者周榜

更多
牛客网
牛客企业服务