字节跳动校招推荐算法一面凉经

- 自我介绍
- 介绍强化学习实习项目
- reward怎么设的,state是什么,action是什么,为什么用强化学习
- TD时序差分是什么, TD和蒙特卡洛的区别是什么
- 推导贝尔曼方程,贝尔曼方程里的gamma如果设成1会怎么样,设成0的话与监督学习有区别吗
- 样本不均衡的解决方法有哪些,focal loss的原理
- 手写堆排序


#面经##字节跳动##算法工程师##校招#
全部评论
楼主你好,请问你是实习、校招还是社招?
点赞 回复 分享
发布于 2020-07-28 15:19
lz面的哪个部门
点赞 回复 分享
发布于 2020-07-28 15:53
手写堆排有点硬啊
点赞 回复 分享
发布于 2020-07-29 10:19
这是推荐算法?
点赞 回复 分享
发布于 2020-07-30 19:01
直观感受做的很硬核,这也能挂吗?
点赞 回复 分享
发布于 2020-08-03 23:51
强,TD和蒙特卡洛,贝尔曼这是啥能解释下吗帮
点赞 回复 分享
发布于 2020-08-21 15:00
堆排序没写出来吗。。。
点赞 回复 分享
发布于 2020-08-21 15:07

相关推荐

点赞 评论 收藏
分享
评论
2
23
分享
牛客网
牛客企业服务