百度现场面一二面面经(二面挂)
一面:(12点15开始,大约30分钟)
自我介绍
介绍项目
对话系统如何设计的?你负责哪些部分,遇到什么样的问题?
问实习的内容:
面试官引出了一些问题,文本多标签分类是怎么做的,为什么用多个二分类器做,这样做的概率分值具有可比性吗(没有可比性),如果想要可比性例如用在推荐系统中,要怎么改进?(回答了不用多个二分类器,用softmax,多标签判定加个阈值);两个方法比较的优缺点分别是什么?实际运用过程性能怎么样?
文本相似度为什么采用余弦相似度,了解其他的吗?(回答了欧式距离jaccard相似度,和dssm模型),LR做文本相似度设计了哪些特征?
画出CNN用在文本分类问题的结构流程图
算法题:n个人编号为1-n 围成一圈,1开始报数,数到m的人出列,下一个人重新开始报数,最后剩余的人的编号是多少?
二面:(一点40开始,大约一个小时)
自我介绍
让我选一个项目具体介绍难点和解决方案(数据怎么处理的,你的创新点解决了这个难点吗?你觉得这样做还有什么问题遗留吗?)
你了解传统的机器学习方法吗?(说了LR,svm,决策树这些)
手写LR的梯度回传(SGD方法+交叉熵)
除了SGD,还了解其他梯度调参方法吗?(回答了动量和adam)
写一下动量和adam的公式(adam的忘记了没写出来)
SGD有什么缺点?为什么会有这个缺点?动量的提出动机是什么?为什么能够解决SGD的这个缺点?Adam的思想了解吗?为什么梯度是最快的下降方向,能证明吗?(我蒙了。。。。这段很尴尬)
你自己有哪些调参的小trick分享一下(有点蒙,说了学习率会尝试从0.001开始,根据经验进行调大和调小,或者尝试使用学习率衰减,衰减系数通常会设置为0.95)
遇到loss不降有什么办法可以debug?(回答了从数据和模型两个方面进行debug:(1)数据上看是否处理错误,归一化方法选择是否正确;(2)模型结构方法,会检查是否写错了,或者结构设计不合理;)(后来想想回答的方向不对)
如何证明是数据的问题?(回答了换用一批预处理正确的数据来跑模型,或者采样一个小数据的集合来验证)
如何证明是模型的问题?(这个没答好,因为当时内心os,不是数据问题就是模型的问题啊)
提示:如果梯度求导错了,有什么方法可以debug
训练过程中过拟合了怎么办?
L1L2正则有什么区别,为什么正则化能够缓解过拟合,如何证明L1正则化能够带来稀疏性
算法题:给一个无序的数组,求数组中三个数的乘积最大的值
凉凉,二面面试官评价我说,让我回去再好好看看基础
#百度##校招##面经#