offer call 还愿,也总结下秋招吧
节前收到意向,基本确定了。
从3月份找实习以来,时间也挺长的,当然菜鸡是实习没找到。后来7月初面完了京东,觉得太远了,太折腾就没有去。
说说找实习的感受。算法岗真是爆炸,但是能力强的始终不缺地方去吧,只不过感受最深就是身在成都,简历不够优秀,被捞的机会都不是很多吧。有机会的话提前准备啥的最好了。
春招总共就面了几家,远景能源,一面聊的挺好的,结果二面上来就开怼,画风一变, 突然有点不知所措,也是太菜了吧,奥卡姆剃刀当时都不太清楚是啥,只记得好像在哪里见过。
远景面经:
简单介绍下自己 一分钟
看你项目主要用到的是树模型,拿到项目会考虑数据量么(从不同模型对应于不同的数据量或者数据分布的角度回答)
介绍下你的第一个项目,用了哪些方法和技术(说项目尽量可以说的慢一点,时间长一点)(这个面试官不感兴趣,直接跳过进第二个)
第二个住房租金比赛讲讲流程
主要是特征工程方面你做了哪些(数据预处理,构建特征,特征选择)
(你构造了几十维特征再进行特征筛选,岂不是没特征)答:原始存在20维,加上自己构造,最终也有30维的特征
怎么样防止过拟合的?
特征工程的流程?怎么判断你构造的特征的好坏呢?
有哪些调参的方法呢?(最好看下贝叶斯调参,这样能说的多一点)
网格调参速度慢,怎么优化一下呢?(面试官自己瞎提的,自己突然想到的问题,我问他答案,他说也在思考。。。。。。。)
怎么样进行特征选择?(皮尔逊系数?解释下皮尔逊相关系数是怎么选的呢?)
特征间的关系考虑过么?
你对python有什么看法?
什么时候能来实习?
有什么问题问我的?
看你项目主要用到的是树模型,拿到项目会考虑数据量么(从不同模型对应于不同的数据量或者数据分布的角度回答)
介绍下你的第一个项目,用了哪些方法和技术(说项目尽量可以说的慢一点,时间长一点)(这个面试官不感兴趣,直接跳过进第二个)
第二个住房租金比赛讲讲流程
主要是特征工程方面你做了哪些(数据预处理,构建特征,特征选择)
(你构造了几十维特征再进行特征筛选,岂不是没特征)答:原始存在20维,加上自己构造,最终也有30维的特征
怎么样防止过拟合的?
特征工程的流程?怎么判断你构造的特征的好坏呢?
有哪些调参的方法呢?(最好看下贝叶斯调参,这样能说的多一点)
网格调参速度慢,怎么优化一下呢?(面试官自己瞎提的,自己突然想到的问题,我问他答案,他说也在思考。。。。。。。)
怎么样进行特征选择?(皮尔逊系数?解释下皮尔逊相关系数是怎么选的呢?)
特征间的关系考虑过么?
你对python有什么看法?
什么时候能来实习?
有什么问题问我的?
然后就是腾讯,(通过这次面试,让我知道你不会c++聊的再好也没啥用,)一面和面试官聊的好好的,结果一周之后没有消息,去问了内推人,觉得不会c++,的确,自己不会这种只能怪自己菜。
所以不论是什么岗还是要一门开发语言吧,可能你算法足够牛逼不会被问到这个东西,但是一般人还是要会一门开发语言,好像真的只会用python,等于不会编程呢。
腾讯大致的面经如下:
自我介绍
实验室主要的方向,自己的研究方向,发论文没有?有没有往自然语言处理等具体方向发展?(项目驱动)
介绍下育碧的项目?(项目时间比较集中?主要之前做知识储备)
数据量多大
育碧项目最终的评价标准?
主要用到树模型,那么介绍下xgboost和lgb(介绍原理,与gbdt对比的介绍,介绍xgboost和lgb的优点:效率高,速度快等)
大数据比赛怎么做的?(从背景-数据预处理-特征工程-特征选择=模型调参)
第一个关键词提取是怎么做的,为什么选取embedrank++算法
词向量和句向量是怎么得到的?(面试官说了什么rnn懵逼,没听懂)
平常主要 用什么语言?c了解么??c++呢?(只会python其他不会)
你有什么要问我的?(介绍下部门主要做的推荐)
PYTHON处理100g数据
lgb怎么并行
实验室主要的方向,自己的研究方向,发论文没有?有没有往自然语言处理等具体方向发展?(项目驱动)
介绍下育碧的项目?(项目时间比较集中?主要之前做知识储备)
数据量多大
育碧项目最终的评价标准?
主要用到树模型,那么介绍下xgboost和lgb(介绍原理,与gbdt对比的介绍,介绍xgboost和lgb的优点:效率高,速度快等)
大数据比赛怎么做的?(从背景-数据预处理-特征工程-特征选择=模型调参)
第一个关键词提取是怎么做的,为什么选取embedrank++算法
词向量和句向量是怎么得到的?(面试官说了什么rnn懵逼,没听懂)
平常主要 用什么语言?c了解么??c++呢?(只会python其他不会)
你有什么要问我的?(介绍下部门主要做的推荐)
PYTHON处理100g数据
lgb怎么并行
阿里 菜鸡也被阿里捞起来了,当时和同学在外面玩就没有认真的去面试,所以也是自己浪费了机会。奇怪的是周围找实习的时候面腾讯阿里算法题考的不是特别多,不过还是要准备的哈。
百度 二面挂,一面的面试官一直在引导,所以表现的还ok,等到了二面,对面是一个做文本的,方向不对,聊的也不多,然后就挂了,百度每一面都需要手撕代码,形式就是线上视频面试,
所以代码题准备好优势很大吧。
海康威视 都快结束了被捞起来了,没啥用,一面技术,一面hr,面完了估计没hc就没了后续。
京东 投递日常实习吧,然后面过了,上面解释了觉得时间太晚了就没去。
京东面经:
历史套餐3000维,为啥不直接用对应的id
用户行为数据特征具体维度对应的含义(多举例)
为什么不用当前套餐特征进行输入
提到短信几百条,你是怎么做的(归一化 我瞎说)
你提到了youtube推荐,具体怎么做的,对连续性特征怎么做的
推荐对于离散型 连续型特征的做法,,
batchnormalization解释一下
bn对于训练集和测试集使用有啥区别
介绍word2vec
介绍负采样,细节
为什么要优化
用户行为数据特征具体维度对应的含义(多举例)
为什么不用当前套餐特征进行输入
提到短信几百条,你是怎么做的(归一化 我瞎说)
你提到了youtube推荐,具体怎么做的,对连续性特征怎么做的
推荐对于离散型 连续型特征的做法,,
batchnormalization解释一下
bn对于训练集和测试集使用有啥区别
介绍word2vec
介绍负采样,细节
为什么要优化
以上是实习部分,有点碎碎念了,各位将就的看!
实习对秋招的影响只有自己面试才能感受吧,毕竟实验室项目怎么样只要你待过实验室就知道,就没几个上线的,太low,没有实习找的真的是太累了。
秋招
拼多多二面挂了:https://www.nowcoder.com/discuss/231889贴个地址,之前写的
网易二面挂:二面有点劝退面吧
面了星环科技,太累了,一共四面,三面线上,一面线下,
面经如下:
自我介绍
做一下题口述(leetcode469)easy 但我尬住了
介绍一下比赛怎么做的
缺失值怎么填充的(均值众数)
还有其他方法么?用机器学习算法预测,还有其他的么?我真的不会了
异常值(介绍下箱型图)
还有哪些处理异常值的方法 (30和画图))
怎么做的特征
模型采用的lgb那么介绍下树模型
熵的计算公式
决策树怎么处理连续值 的
gbdt用残差有哪些缺点
gbdt怎么做的分类(还是用残差么)
xgboost相对gbdt有哪些不同
业务场景,有三个表,一个用户表,一个物品表,一个购买时间表,怎么构建一些时序的特征
自我介绍
项目介绍
问具体特征的构建,模型的输入(主要问业务方面)
模型采用的什么优化方法(adam)
为什么用adam(大家都用?回答说速度快)
adam原理解释一下(哇,电话推公式伤不起,说了一阶动量和二阶动量)
一阶动量二阶动量具体代表的含义
为什么这么做(主要去保留前面的梯度)
这里面分类可以用lgb么
为什么用lgb不合适(这里解释的不好,特征稀疏输进去真的好?懵逼这里)
介绍下树模型吧(ID3 C4.5 CART GBDT XGBOOST)
讲到信息增益的时候问信息增益只能通过熵来求么?有其他方法么?(懵逼,又不知道)
gbdt为什么要对均方误差求导呢?
xgboost(二阶泰勒展开是对谁展开)
寻找最优分裂点为什么要对hi的权重进行求分位数?
算法题:菲波那切数列知道么?
怎么求?复杂度(说了一个O(2^N))
怎么优化一下呢(递推记录,O(N))
还能优化一下么?(O(logN))这个真不会,我在瞎扯
做一下题口述(leetcode469)easy 但我尬住了
介绍一下比赛怎么做的
缺失值怎么填充的(均值众数)
还有其他方法么?用机器学习算法预测,还有其他的么?我真的不会了
异常值(介绍下箱型图)
还有哪些处理异常值的方法 (30和画图))
怎么做的特征
模型采用的lgb那么介绍下树模型
熵的计算公式
决策树怎么处理连续值 的
gbdt用残差有哪些缺点
gbdt怎么做的分类(还是用残差么)
xgboost相对gbdt有哪些不同
业务场景,有三个表,一个用户表,一个物品表,一个购买时间表,怎么构建一些时序的特征
项目介绍
问具体特征的构建,模型的输入(主要问业务方面)
模型采用的什么优化方法(adam)
为什么用adam(大家都用?回答说速度快)
adam原理解释一下(哇,电话推公式伤不起,说了一阶动量和二阶动量)
一阶动量二阶动量具体代表的含义
为什么这么做(主要去保留前面的梯度)
这里面分类可以用lgb么
为什么用lgb不合适(这里解释的不好,特征稀疏输进去真的好?懵逼这里)
介绍下树模型吧(ID3 C4.5 CART GBDT XGBOOST)
讲到信息增益的时候问信息增益只能通过熵来求么?有其他方法么?(懵逼,又不知道)
gbdt为什么要对均方误差求导呢?
xgboost(二阶泰勒展开是对谁展开)
寻找最优分裂点为什么要对hi的权重进行求分位数?
算法题:菲波那切数列知道么?
怎么求?复杂度(说了一个O(2^N))
怎么优化一下呢(递推记录,O(N))
还能优化一下么?(O(logN))这个真不会,我在瞎扯
介绍项目
负样本怎么构建的(你觉得合理么)
向量是怎么构建的?(为什么维度这么高)
数据不平衡怎么处理
怎么进行上采样和下采样(这样做的方式有哪些问题?)
smote算法(介绍,用过么?它有哪些缺陷,适用于什么样的数据)
介绍一下wide and deep
wide作用是啥?deep作用是啥?(各适用于什么样的数据?不会,尬住了)
推荐系统的粗排,精排,后处理有有了解过么?
项目上线了么?
场景题,给出银行的理财产品,请对用户进行推荐(规则,构建用户画像,基于用户和物品相似度计算)?
能否用你自己做的项目把场景题做一下
然后现在星环科技还没消息,建议大家以后不要寄希望小公司吧,个别的是速度慢,等不起,多去找找。
负样本怎么构建的(你觉得合理么)
向量是怎么构建的?(为什么维度这么高)
数据不平衡怎么处理
怎么进行上采样和下采样(这样做的方式有哪些问题?)
smote算法(介绍,用过么?它有哪些缺陷,适用于什么样的数据)
介绍一下wide and deep
wide作用是啥?deep作用是啥?(各适用于什么样的数据?不会,尬住了)
推荐系统的粗排,精排,后处理有有了解过么?
项目上线了么?
场景题,给出银行的理财产品,请对用户进行推荐(规则,构建用户画像,基于用户和物品相似度计算)?
能否用你自己做的项目把场景题做一下
其他的贝壳笔试过了,去北京太远了,懒得去,去的虽然给的base高,但是挺严格的,风险太大了
小米 一面估计挂了,题没写好。
以上所有的面经大部分还是基于项目来问的,特别是最近的面试感受,项目上展开发散过来的。
面试总共就要准备三个点:
代码+项目+基础
基础大多数都是项目中来问的,
代码提前准备好,刷刷剑指offer leetcode 高频题,200题会写起码面试就百毒不侵了,当然不排除特别变态的那种,我是 菜鸡没有遇到过。
主要还是心态上放好,越想去的公司可能去不到,不太想去的可能放轻松去面,反而效果也许还不错,我就相当于捡漏小公司,实际上自己菜得很。
战略也重要吧,海投的过程发现大厂自己都挂掉了就不要老是盯着大厂了,进去与否还需要结合一定的运气吧,大佬们就忽略了。
顺路吐槽下,实习千万别海投,投递过了秋招不给机会就很恶心了。
写的有点多了,有什么问题可以下面提问,看到了会解答下。
以上仅代表个人观点啊。
本来以为秋招结束会写很长一段,当真正有时间写的时候,心有点累,虽然和预期目标不是很符合,但是我是条咸鱼,小富即安,公司给的base还可以吧,
十月份之后,再找找,再看看,
希望大家能找到心仪的offer
也感谢各位看官看到这里,忍受了一个巨麻烦巨啰嗦的人的碎碎念,感谢,有啥问题,私信,留言都可以,知无不言。