lz主要做RL方向 4月10日 一天三面 一面 60min 自我介绍; 做题:二分搜索左边界(lc.34):只把最基本的二分搜索写出来了,搜索左边界的边界处理问题一直没写好,最后面试官老师也没评价(做题过程全程无交流); 介绍一下传统机器学习方法:从概念上介绍了一下SVM、逻辑回归和决策树; 用通俗的语言介绍一下RL,基本问题:介绍了RL的应用背景,与其他深度学习方法最大的差异,以及RL中探索-利用、同策略异策略问题; 二面 60min 面试官老师先介绍了自己负责百度APP搜索变现策略; 介绍项目—>模型结合方法:反复介绍了很久AC结构的训练原理...