字节跳动推荐算法一面面经

  1. L1 和 L2 正则化的区别?它们都能防止过拟合吗?
  2. 写出Cross entropy的公式,并解释推导过程。(我先从KL散度的角度回答,面试官提示从最大似然的角度回答,并问是否与贝叶斯有关)
  3. 解释dropout的作用,训练和测试阶段是否有区别,如何解决dropout预估偏高的问题?
  4. 如何判断模型是否过拟合?(仅仅训练集loss低,测试集loss高不一定是过拟合,有没有其他判断方式?我从模型偏差和方差的角度回答)
  5. 如何缓解过拟合?(我说了四五种方法,面试官继续追问有没有其他方法)
  6. 概率题:计算骰子第一次扔到6的次数的期望。
  7. 解释AUC的定义,它解决了什么问题,优缺点是什么,并说出工业界如何计算AUC。(特别是在大规模数据情况下)
  8. 代码题:计算中缀表达式的结果,包括括号。(例如:‘1+2*(3-(65+2)*2)’)

全部评论
所以交叉熵和贝叶斯有关吗?交叉熵其实是后验概率的损失,贝叶斯是用后验概率计算先验概率?
1 回复 分享
发布于 09-15 20:51 江苏
请问dropout预估偏高是指什么,如何解决呢
点赞 回复 分享
发布于 09-03 20:56 天津

相关推荐

评论
29
99
分享
牛客网
牛客企业服务