offer call 还愿,也总结下秋招吧

节前收到意向,基本确定了。

从3月份找实习以来,时间也挺长的,当然菜鸡是实习没找到。后来7月初面完了京东,觉得太远了,太折腾就没有去。

说说找实习的感受。算法岗真是爆炸,但是能力强的始终不缺地方去吧,只不过感受最深就是身在成都,简历不够优秀,被捞的机会都不是很多吧。有机会的话提前准备啥的最好了。
春招总共就面了几家,远景能源,一面聊的挺好的,结果二面上来就开怼,画风一变, 突然有点不知所措,也是太菜了吧,奥卡姆剃刀当时都不太清楚是啥,只记得好像在哪里见过。
远景面经:
简单介绍下自己 一分钟
看你项目主要用到的是树模型,拿到项目会考虑数据量么(从不同模型对应于不同的数据量或者数据分布的角度回答)
介绍下你的第一个项目,用了哪些方法和技术(说项目尽量可以说的慢一点,时间长一点)(这个面试官不感兴趣,直接跳过进第二个)
第二个住房租金比赛讲讲流程
主要是特征工程方面你做了哪些(数据预处理,构建特征,特征选择)
(你构造了几十维特征再进行特征筛选,岂不是没特征)答:原始存在20维,加上自己构造,最终也有30维的特征
怎么样防止过拟合的?
特征工程的流程?怎么判断你构造的特征的好坏呢?
有哪些调参的方法呢?(最好看下贝叶斯调参,这样能说的多一点)
网格调参速度慢,怎么优化一下呢?(面试官自己瞎提的,自己突然想到的问题,我问他答案,他说也在思考。。。。。。。)
怎么样进行特征选择?(皮尔逊系数?解释下皮尔逊相关系数是怎么选的呢?)
特征间的关系考虑过么?
你对python有什么看法?
什么时候能来实习?
有什么问题问我的?


然后就是腾讯,(通过这次面试,让我知道你不会c++聊的再好也没啥用,)一面和面试官聊的好好的,结果一周之后没有消息,去问了内推人,觉得不会c++,的确,自己不会这种只能怪自己菜。
所以不论是什么岗还是要一门开发语言吧,可能你算法足够牛逼不会被问到这个东西,但是一般人还是要会一门开发语言,好像真的只会用python,等于不会编程呢。

腾讯大致的面经如下:
自我介绍
实验室主要的方向,自己的研究方向,发论文没有?有没有往自然语言处理等具体方向发展?(项目驱动)
介绍下育碧的项目?(项目时间比较集中?主要之前做知识储备)
数据量多大
育碧项目最终的评价标准?
主要用到树模型,那么介绍下xgboost和lgb(介绍原理,与gbdt对比的介绍,介绍xgboost和lgb的优点:效率高,速度快等)
大数据比赛怎么做的?(从背景-数据预处理-特征工程-特征选择=模型调参)
第一个关键词提取是怎么做的,为什么选取embedrank++算法
词向量和句向量是怎么得到的?(面试官说了什么rnn懵逼,没听懂)
平常主要 用什么语言?c了解么??c++呢?(只会python其他不会)
你有什么要问我的?(介绍下部门主要做的推荐)


PYTHON处理100g数据
lgb怎么并行


阿里   菜鸡也被阿里捞起来了,当时和同学在外面玩就没有认真的去面试,所以也是自己浪费了机会。奇怪的是周围找实习的时候面腾讯阿里算法题考的不是特别多,不过还是要准备的哈。

百度    二面挂,一面的面试官一直在引导,所以表现的还ok,等到了二面,对面是一个做文本的,方向不对,聊的也不多,然后就挂了,百度每一面都需要手撕代码,形式就是线上视频面试,
所以代码题准备好优势很大吧。

海康威视   都快结束了被捞起来了,没啥用,一面技术,一面hr,面完了估计没hc就没了后续。

京东    投递日常实习吧,然后面过了,上面解释了觉得时间太晚了就没去。
京东面经:
历史套餐3000维,为啥不直接用对应的id
用户行为数据特征具体维度对应的含义(多举例)
为什么不用当前套餐特征进行输入
提到短信几百条,你是怎么做的(归一化 我瞎说)
你提到了youtube推荐,具体怎么做的,对连续性特征怎么做的

推荐对于离散型  连续型特征的做法,,  

batchnormalization解释一下
bn对于训练集和测试集使用有啥区别

介绍word2vec
介绍负采样,细节
为什么要优化




以上是实习部分,有点碎碎念了,各位将就的看!

实习对秋招的影响只有自己面试才能感受吧,毕竟实验室项目怎么样只要你待过实验室就知道,就没几个上线的,太low,没有实习找的真的是太累了。

秋招

拼多多二面挂了:https://www.nowcoder.com/discuss/231889贴个地址,之前写的
网易二面挂:二面有点劝退面吧

面了星环科技,太累了,一共四面,三面线上,一面线下,
面经如下:
自我介绍
做一下题口述(leetcode469)easy 但我尬住了
介绍一下比赛怎么做的
缺失值怎么填充的(均值众数)
还有其他方法么?用机器学习算法预测,还有其他的么?我真的不会了
异常值(介绍下箱型图)
还有哪些处理异常值的方法 (30和画图))
怎么做的特征
模型采用的lgb那么介绍下树模型
熵的计算公式
决策树怎么处理连续值 的
gbdt用残差有哪些缺点
gbdt怎么做的分类(还是用残差么)
xgboost相对gbdt有哪些不同
业务场景,有三个表,一个用户表,一个物品表,一个购买时间表,怎么构建一些时序的特征

自我介绍
项目介绍
问具体特征的构建,模型的输入(主要问业务方面)
模型采用的什么优化方法(adam)
为什么用adam(大家都用?回答说速度快)
adam原理解释一下(哇,电话推公式伤不起,说了一阶动量和二阶动量)
一阶动量二阶动量具体代表的含义
为什么这么做(主要去保留前面的梯度)
这里面分类可以用lgb么
为什么用lgb不合适(这里解释的不好,特征稀疏输进去真的好?懵逼这里)
介绍下树模型吧(ID3 C4.5 CART GBDT XGBOOST)
讲到信息增益的时候问信息增益只能通过熵来求么?有其他方法么?(懵逼,又不知道)
gbdt为什么要对均方误差求导呢?
xgboost(二阶泰勒展开是对谁展开)
寻找最优分裂点为什么要对hi的权重进行求分位数?
算法题:菲波那切数列知道么?
怎么求?复杂度(说了一个O(2^N))
怎么优化一下呢(递推记录,O(N))
还能优化一下么?(O(logN))这个真不会,我在瞎扯

介绍项目
负样本怎么构建的(你觉得合理么)
向量是怎么构建的?(为什么维度这么高)
数据不平衡怎么处理
怎么进行上采样和下采样(这样做的方式有哪些问题?)
smote算法(介绍,用过么?它有哪些缺陷,适用于什么样的数据)
介绍一下wide and deep
wide作用是啥?deep作用是啥?(各适用于什么样的数据?不会,尬住了)
推荐系统的粗排,精排,后处理有有了解过么?
项目上线了么?
场景题,给出银行的理财产品,请对用户进行推荐(规则,构建用户画像,基于用户和物品相似度计算)?
能否用你自己做的项目把场景题做一下

然后现在星环科技还没消息,建议大家以后不要寄希望小公司吧,个别的是速度慢,等不起,多去找找。

其他的贝壳笔试过了,去北京太远了,懒得去,去的虽然给的base高,但是挺严格的,风险太大了

小米 一面估计挂了,题没写好。

以上所有的面经大部分还是基于项目来问的,特别是最近的面试感受,项目上展开发散过来的。

面试总共就要准备三个点:
代码+项目+基础

基础大多数都是项目中来问的,
代码提前准备好,刷刷剑指offer  leetcode 高频题,200题会写起码面试就百毒不侵了,当然不排除特别变态的那种,我是 菜鸡没有遇到过。

主要还是心态上放好,越想去的公司可能去不到,不太想去的可能放轻松去面,反而效果也许还不错,我就相当于捡漏小公司,实际上自己菜得很。

战略也重要吧,海投的过程发现大厂自己都挂掉了就不要老是盯着大厂了,进去与否还需要结合一定的运气吧,大佬们就忽略了。

顺路吐槽下,实习千万别海投,投递过了秋招不给机会就很恶心了。

写的有点多了,有什么问题可以下面提问,看到了会解答下。

以上仅代表个人观点啊。

本来以为秋招结束会写很长一段,当真正有时间写的时候,心有点累,虽然和预期目标不是很符合,但是我是条咸鱼,小富即安,公司给的base还可以吧,

十月份之后,再找找,再看看,

希望大家能找到心仪的offer

也感谢各位看官看到这里,忍受了一个巨麻烦巨啰嗦的人的碎碎念,感谢,有啥问题,私信,留言都可以,知无不言。


#腾讯##星环##远景能源有限公司##京东##面经##实习##校招#
全部评论
能写这么多很厉害,lz现在准备去哪
点赞 回复 分享
发布于 2019-10-02 15:41
感谢楼主分享。
点赞 回复 分享
发布于 2019-10-02 15:45
小哥,问一下python如何处理100g数据?
点赞 回复 分享
发布于 2019-10-02 21:31
老哥,准备去哪个?
点赞 回复 分享
发布于 2019-10-02 21:47
斐波那契数列可以通过矩阵快速幂把求第n项降低到logn的复杂度。
点赞 回复 分享
发布于 2019-10-03 12:24
请问小米是几号面的
点赞 回复 分享
发布于 2019-10-10 16:40
哇,楼主最后去了百度哇。请问下是春招过的百度么
点赞 回复 分享
发布于 2020-05-13 17:05
想问下,星环科技是小公司嘛,刚电话面了杭州数分实习生,推荐去嘛
点赞 回复 分享
发布于 2021-01-05 15:35

相关推荐

17 45 评论
分享
牛客网
牛客企业服务