网易互娱 深度强化学习岗面经
一面:(基础面)
part1 深度学习
1.分类,聚类,回归区别
2.激活函数的作用
3.卷积的计算(1*1*n)
4.常见的CNN架构
5.训练集,验证集,测试集
6.正则化操作常见的都有哪些,batch normalization思想
7.梯度爆炸和梯度消失原因,解决策略
8.过拟合原因,解决方案
9.learning rate过小、过大的结果,learning rate decreasing
10.cnn的参数共享是什么
part2 强化学习
1.mc,td,动态规划之间的区别与联系
2.off-policy和on-policy
3.tensorflow的降维
4.简述q learning
代码:
input:1,2,3,4,5,7,9,11,12,13,18
output:1,5,7,9,11,13,18
删除中间连续数字,保留头尾。如果不连续就输出单个数字。
二面:(感觉像技术+hr)
1.介绍你对强化学习的了解,主要分几类,分别有哪些算法,主要思想是什么
2.谈论文,2篇论文分别解决了什么问题,主要用到了什么算法
3.假如面试官是一个零基础的深度学习学习者,那么有什么建议,如何入门?
4.论文中的方法有多少是自己提出的?论文中的代码/平台是自己完全手动搭建的,还是在别人基础上改的?
5.强化学习在游戏中能有哪些应用?该怎么实现?
6.评价自己导师
7.平时玩游戏多吗,都玩过哪些游戏
8.如果来实习,导师会同意吗?
三面:(感觉像技术总监/部门主管)
1.除了论文外,是否还有其他机器学习实际应用的项目经历
2.游戏经历
3.情景题,强化学习在游戏中的应用,问的很细,很深
4.啥时候能来实习
5.平时周末在干嘛
6.什么时候开始接触机器学习
7.怎么知道的这个岗位的信息
8.还投了其他公司吗,什么岗位
#网易互娱##面经##算法工程师##机器学习#
part1 深度学习
1.分类,聚类,回归区别
2.激活函数的作用
3.卷积的计算(1*1*n)
4.常见的CNN架构
5.训练集,验证集,测试集
6.正则化操作常见的都有哪些,batch normalization思想
7.梯度爆炸和梯度消失原因,解决策略
8.过拟合原因,解决方案
9.learning rate过小、过大的结果,learning rate decreasing
10.cnn的参数共享是什么
part2 强化学习
1.mc,td,动态规划之间的区别与联系
2.off-policy和on-policy
3.tensorflow的降维
4.简述q learning
代码:
input:1,2,3,4,5,7,9,11,12,13,18
output:1,5,7,9,11,13,18
删除中间连续数字,保留头尾。如果不连续就输出单个数字。
二面:(感觉像技术+hr)
1.介绍你对强化学习的了解,主要分几类,分别有哪些算法,主要思想是什么
2.谈论文,2篇论文分别解决了什么问题,主要用到了什么算法
3.假如面试官是一个零基础的深度学习学习者,那么有什么建议,如何入门?
4.论文中的方法有多少是自己提出的?论文中的代码/平台是自己完全手动搭建的,还是在别人基础上改的?
5.强化学习在游戏中能有哪些应用?该怎么实现?
6.评价自己导师
7.平时玩游戏多吗,都玩过哪些游戏
8.如果来实习,导师会同意吗?
三面:(感觉像技术总监/部门主管)
1.除了论文外,是否还有其他机器学习实际应用的项目经历
2.游戏经历
3.情景题,强化学习在游戏中的应用,问的很细,很深
4.啥时候能来实习
5.平时周末在干嘛
6.什么时候开始接触机器学习
7.怎么知道的这个岗位的信息
8.还投了其他公司吗,什么岗位
#网易互娱##面经##算法工程师##机器学习#