头条提前批一面分享
1.AUC
AUC是指曲线下面积,一般用于ROC(受试者工作特性曲线)围成的面积。
ROC是根据TPR、FPR进行绘制的。
2.LR损失函数
LR损失函数叫最大似然损失函数(交叉熵):
3.常见损失函数有哪些
(1) Zero-one Loss(0-1损失)
(2) Perceptron Loss(感知损失)
(3) Hinge Loss(合页损失)
(4) 交叉熵损失函数
(5) 平方误差损失函数
(6) Absolute Loss
(7) Exponential Loss
(损失函数有哪些 https://zhuanlan.zhihu.com/p/47202768)
4.防止过拟合的方法
机器学习中用来防止过拟合的方法有哪些?https://www.zhihu.com/question/59201590
5.防止梯度消失的方法
-
预训练加微调
-
梯度剪切、权重正则(针对梯度爆炸)
-
使用不同的激活函数
-
使用batchnorm
-
使用残差结构
-
使用LSTM网络
详解机器学习中的梯度消失、爆炸原因及其解决方法 https://blog.csdn.net/qq_25737169/article/details/78847691
6.sigmoid优缺点
优点:形式简单,输出是[0,1]就是概率值。
缺点:梯度弥散;指数计算慢
常用激活函数的比较
https://zhuanlan.zhihu.com/p/32610035
7.L1、L2正则化
范数p <= 1的具有稀疏解;范数p >=2 的具有压缩系数的作用,减小模型复杂度。
机器学习中正则化项L1和L2的直观理解
https://blog.csdn.net/jinping_shi/article/details/52433975
算法题:
第一题:
O(n)时间复杂度和O(1)空间复杂度删除重复元素,数组有序,输入a=[1,1,1,2,5,6,6],输出a=[1,2,5,6]
双指针:比较 i,j,a[i]==a[j] ,j++;不等就交换i+1和j,然后j++,最后返回有效长度。
第二题:
拓扑排序。
#字节跳动##算法工程师##面经##校招#