记录一下各种面试
写写面经,攒攒人品~
一.阿里
1.自我介绍
2.项目介绍
3.逻辑回归的多分类,逻辑回归和softmax的关系,逻辑回归损失函数,梯度推导(手写)
4.梯度和学习率的作用
5.有些方程(如高中学习的方程组)能直接求解,为什么深度学习里要用采用求梯度的迭代的方式进行求解?
(说实话不太懂,我回答了迭代是一种近似求解的方式,能直接求解那更好,有了解的大佬麻烦指点一下)
6.优化器,sgd、adam ,手写 adam 公式。
7.既然 adam 是自适应学习率,那自定义的学习率意义是什么?(同样求大佬解答)
8.介绍 LSTM、Transformer,手写 LSTM 公式
9.所知道的损失函数,MSE为什么不能用在分类
10.手撕代码,字符串反转,单词(连续字母)不反转
11.Q&A
二.网易
- 一面
2.项目介绍
3.为什么不用Bert,对Bert的了解
4.word2vec的两种形式(CBOW和skip-gram),以及两种优化方法的思路(分层softmax,负采样)
5.详细讨论了分层softmax的计算过程
6.Transformer的结构以及各部分的作用
7.Transformer的decorder部分的mask和encorder部分的mask有什么不同(平时只用了encorder的部分,没关注要decorder的问题)
8.有看过这些框架的原始论文吗
9.Python的复制问题
10.手撕代码,有头尾相连的N张车票,且没有重复,如何根据这些车票确定列车行驶的路线。
11.Q&A
- 二面
2.介绍自己觉得比较重要的项目,其中的难点和解决思路
3.项目如何应用到公司的业务中,如CC直播的弹幕
4.对机器学习的了解。LR和SVM,两者的异同等
5.决策树是否了解,展开讲。面试官一直没什么反应,只让接着讲,所从这里开始就一直讲讲讲,从决策树到bagging,boosting,GBDT,XGBoost
6.说到XGBoost,是否了解Lightgbm。(不了解,只知道是对XGBoost的改进)
7.对Bert等预训练模型的了解
8.C++掌握的怎样?C++的虚函数是什么
9.C语言的malloc() 和 free()的作用
10.python常见的数据类型
11.Java的某某关键字的作用,我没听清,再问一次的时候面试官感觉我也不了解就说下一个了
12.手撕代码:如何一次遍历得到链表的中间结点。(这问题写过好几次,面试时居然没想起来怎么解,估计也是挂在这了)
13.Python多线程是否用过?(没用过)线程和进程有什么区别和联系?
14.TCP的头结构
15.数据库的了解(说了会增删改查就没问了)
16.有关注哪些顶会,平时怎么阅读论文
16.Q&A
感觉还是得多多学习啊~~