结束秋招,面经总结
多益
常规介绍项目后
- 讲一下lr与线性模型的区别
- 为什么说lr加了非线性因素
- 讲一下RNN
- RNN与LSTM区别在哪
- 如何防止过拟合
有些不记得了(offer)
深信服
一面
- 介绍最深刻的项目,在这个项目中最重要的是什么
- lr使用什么损失函数,为什么不用差平方,用差平方与交叉熵差别在哪
- 如何解决样本不平衡问题
- 现在有很多题,每个题对应不同的分数,抽一部分题组成一张试卷,使得分数为100
- 排序算法介绍,它们的复杂度
- 熟悉什么语言-python
- 介绍下lambda
- 介绍下filter
- python写一个单例模式
- python里面线程与进程
- 进程如何共享内存
- 有一篇英文文章,统计出出现次数最多的100个词
二面
- 介绍下项目
- 有一个分类任务有几千个类,应该怎么去训练模型
- 如何提取文本关键字
- 跳台阶
三面
- 二维平面有n个点,求点p,其到所有点距离之和最小
- 陷入局部最优值怎么办
- xgboost相对于GBDT的优点,为什么会快些
- xgboost如何做并行
- 信息熵的定义
- 求一个数的二进制表示有多少个1(这个是看我C/C++用得太少了考我基础)
- 讲项目
hr面
自我介绍,家哪里的,有没有女朋友,女朋友哪里的,爸妈做什么,身边的人如何评价你,你有什么缺点,期望薪水,可以接受留在长沙不,以后的职业规划,对深信服的工作是否感兴趣
有没有什么想问的(请问公司的培训体系是?)这个你拿到offer再说(这是什么操作???)
hr有点咬字不清晰,我好几次听不清楚问了他几次,印象不太好。
作业帮
- 介绍项目
- 对方: 1、c语言实现strcpy 2、快速排序
- 对方: 如何从200亿数字中,找到最大的100个
- 对方: 两个随机数产生器,R1以0.7的概率产生1,以0.3的概率产生0.R2以0.3的概率产生1,0.7的概率产生0.问如何组合这两种产生器,使新得到的随机数产生器 以0.5的概率产生1,0.5的概率产生0。随机数产生器可复用。
- 对方: 有两个随机数产生器,R1以0.7的概率产生1,R2以0.3的概率产生1,问如何组合这两种产生器,使新得到的随机数产生器 以0.5的概率产生1,0.5的概率产生0。随机数产生器可复用。
- 对方: 已知二叉树的先序和中序遍历序列,如何还原二叉树的结构
当时开始得比较早,没准备好
腾讯 推荐系统
- 推荐系统你是怎么理解的
- 推荐系统的数据流和业务流是什么样子的,数据由哪里产生,做怎样的处理,又流到哪里去
- 怎么获取用户的历史记录
- 说得太笼统了,就是怎么获取历史信息,这里面又有哪些信息
- 怎么去做特征工程,数据有哪种类型,每种类型怎么去做特征工程
- 用户年龄怎么去做特征工程
- 某个年龄段数据比较少,或者某个业务在这个年龄段里用户比较少,那该怎么办
- 性别怎么做特征
- 职业怎么做特征,比如说老师,工程师,公务员
- 怎么做统计特征
- 推荐算法有哪些?可以用于推荐的
- 就是怎么应用的,你举一个模型讲解一下嘛(这里暴露了一个问题,就是我回答的时候总是问一个说一点,不会扩充,说得太少了)
- 怎么预估,得到一个概率吗
- 树模型怎么做
- 你刚提到的树模型+lr,具体方法是什么
- 还有没有什么别的方法可以结合
- 推荐这一块还有没有别的算法吗
- 比如说冷启动的话有什么算法
- 挑一个项目讲解一下(这里是不是讲图网络的比较好?)
- 商家在某一个时间段会开始搞活动的,这个时候怎么处理
- 你这里写了个上下文特征是什么特征
- 你有什么问题要问的(这里知道了他是SNG的话可以推荐一下自己的图网络算法)
应该仔细揣摩面试官的意图,不用急着回答
推荐算法根本不了解,不应该接这个面试的,完全没准备好。
360
- 你们做转化率的时候没有去重吗
- xgboost与GBDT的区别
- 当特征值很多的时候如何选择分裂点
- 是所有百分位点都计算吗
- 信息增益怎么计算
- 你的图是有向图还是无向图
- 最大子数组和
- 项目问的很详细
网易游戏
- 降维算法有哪些,坐下介绍
- 怎么评估一个模型
- 怎么处理过拟合
- 从数据的角度出发怎么处理过拟合
- 介绍下KNN
- K是怎么选取的
- 如果K过大或K过小有什么问题
- KNN算法的优缺点
- KNN的距离度量方式
- 其他距离度量方式还有哪些
- 介绍下决策树
- 剪枝是为了解决什么问题
- 介绍下对反向传播的理解
- 现在给你一个三层的神经网络,如何做反向传播
- CNN有用到吗,介绍下CNN主要用在哪里
- 操作系统、计算机网络也比较熟悉的是吧
- 进程跟线程的区别是什么
- 多进程跟多进程适用的场景是什么?IO密集型和计算密集型
- 进程间通信有什么手段
- 怎么看某个进程的CPU
- 怎么看某个进程监听了哪个端口
- 有很多字符串,找出出现次数最多的那个
- 字典是用什么实现的
- 换个方法怎么实现22问,工程类的方法,你了解大数据那方面的方法吗
- MapReduce
- 用堆的话怎么实现22问
- GIL介绍一下
- 所以GIL的影响是什么
- 有听说过迭代器吗
- 为什么要用迭代器,相对于列表有什么好处
- 有听说过闭包吗
- 有听说过装饰器吗
- 有了解过python的内存管理机制的吗
- 智能运维做的是对时序数据的分析,类似与异常检测容量预估智能客服方面的
贝壳
一面:
- 乱序数组中查找中位数
- 求二叉树深度
- 求出现次数最多的k个字符串
- 有没有做什么算法改进
二面:
这是我碰过问得最深的面试官,会不断地问为什么,有些问题不记得了
- 特征选择方法有哪些?xgb?你模型本来预测就不准的,用它来筛选岂不是更没依据
- 什么时候用SVM什么时候用LR
- 防止过拟合的方法
- L1 L2的作用
- L1为什么可以稀疏化权重
- 讲一下dropout,为什么可以防止过拟合
- 为啥抽样训练然后加权可以防止过拟合
- 做一个场景题,怎么预测共享单车应该投放多少
三面:
不断地吹贝壳
其他
后面还面了招银网络(offer)、招联金融(等消息)、万得(offer)、苏宁(offer)、东方海外(offer)、大华(offer)等等。华为笔试面试都搞得太随便了,目前还在池子里泡着。。。还有一些零零碎碎的公司不记得了。一般问的都是项目,机器学习算法原理、基础的数据库问题,python的基础问题,大同小异。
总结
今年算法爆炸,很难找工作,特别是像我这种转专业,在研究生期间做得都是数据挖掘和算法研究的,开发基础不够好,导致好几次与大厂插肩而过。找工作也是个认清个人定位的过程,我刚开始也挺不甘心放弃算法的,不过现实嘛,岂能皆如所愿,尽善尽美?适合自己就好。目前综合地域发展各方面的考虑,打算签招银,以后怎么样就看造化了。
明年的算法大家还是可以找的,建议大家加强自己的研发能力,比如说Java、hadoop、spark、数据库基础,能发论文就发,能打比赛多打,这些都是必须的,有ACM更加分。祝大家offer多多,面试都问helloworld
2019-03-21更新
最后去了贝壳。
#秋招##面经##多益网络##深信服##作业帮##算法工程师#