美团机器学习/数据挖掘 一面
主要是使用强化学习相关的:
1.强化学习中马尔可夫(MDP)中的五元组是什么?
2.RL学习能分为哪些类别?
基于值函数的
基于策略的的
3.基于值函数的和基于策略的有哪些模型?
4.解释一下TRPO,PPO
5.解释一下强化学习中的online 和offline
6.是否自己动手实现过一个RL智能体:答:没有
7.广告系统的链路:召回-粗排-精排-重排
8.召回主要用哪些算法?
9.问京东的项目经历
手撕:可以组成括号的成对字串,用了栈秒了,可能时间还有剩余,让我用DP做一下,没做出来。
已经是美团暑期实习的最后一个志愿了,求让我过一面吧,呜呜
1.强化学习中马尔可夫(MDP)中的五元组是什么?
2.RL学习能分为哪些类别?
基于值函数的
基于策略的的
3.基于值函数的和基于策略的有哪些模型?
4.解释一下TRPO,PPO
5.解释一下强化学习中的online 和offline
6.是否自己动手实现过一个RL智能体:答:没有
7.广告系统的链路:召回-粗排-精排-重排
8.召回主要用哪些算法?
9.问京东的项目经历
手撕:可以组成括号的成对字串,用了栈秒了,可能时间还有剩余,让我用DP做一下,没做出来。
已经是美团暑期实习的最后一个志愿了,求让我过一面吧,呜呜
全部评论
我也是这个岗约面试了,但是对数据挖掘完全不懂啊
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享