暑期实习&&秋招算法凉经(反正不是很热)
本人背景先说下,本硕985,就读计算机强校(不是最强的那两个),联邦&&强化方向,机器学习半瓶水,ACM选手(读研三年没写过一道题的那种),手中握有一顶会二作(面试的时候都不说了,会被嘲笑,一作肯定给博士啊),一篇一作在投,简而言之,就是没有文章。这个条件客观讲,程序员中等水平,绝对够不上稀有。
至于面试,我认为大多数面试的知识点其实我们都碰到过,有模糊印象,关键是能不能清晰化,把货倒出来,所以面试之前一定要做三件事:
1.把上次写跪的题手动实现一遍,有规划练题,我作为acm选手过于自负,结果就是自杀。
2.大方向基础知识点背一遍(c++/java/python/机器学习)
3.面试部门方向关键算法背一遍(如推荐算法中的LR model,以及只要是个AI/机器学习都大概率问到的SVM)
4.协调时间(一边写文章一边准备,真的累)
3月
腾讯
一. 犀牛鸟精英科研计划:
一面:
(1)聊天,过
(2)横向pk挂(挂的就是你这种没文章的)(当然也有可能因为工作地点)
二. 北京 teg 联邦组
一面:
(1)sigmoid函数一阶二阶导数的含义
(2)coding : 使用numpy实现下上面的两个导数,过
二面:
(1)自我介绍(总算有正式自我介绍了)
(2)coding:字符串中提取数字,再排下序,合并后输出字符串(快排)
(3)feedback:两面结果都很好,他们会加快进度,争取早发offer
hr面:
(1)自我介绍
(2)项目
(3)家乡,有无亲属在tx,个人缺点,闲聊,过(顺便提醒下,hr面准备不充分,表达不太好)
hr面结束:
加微信,暗示hc不够(?)
字节
抖音推荐算法(比较核心)
一面:
(1)自我介绍
(2)coding:1. 单调队列(没刷过这题啊)2.sqrt(x)两种方法
(3)二维平面上一个点到任意整点距离的分布(我讲了个思路,表达式给出来积分
f(x)f(z-x), 求密度函数,发现不是很好求),过
二面:
(1)自我介绍
(2)coding:大数加减法(有负数,写了个加法,磕磕绊绊,减法要讨论四种情况,这时开始感觉手生)
(3)项目难点
(4)过拟合怎么处理(探测:k-fold validation 正则化方案:L1,L2 奇技淫巧:dropout)
(5)dropout原理(随机失活)
(6)adam和sgd的区别(自适应学习率,mini-batch间防止抖动)
(7)反问环节,过
三面:
(1)自我介绍
(2)coding:sqrt(x)(小于1的情况竟然没写!写过的题竟然还忘了!开始怀疑自己coding能力)
(3)项目难点
(4)1 / t^2和1 / t衰减在凸优化问题中的优劣(真不会,从来没搞过退火,题目都听不懂)(衰减率小,长期抖动,衰减率大,过快失去动量,不能到达最优值)
(5)反问环节:推荐系统采用机器学习是否多于深度网络(被diss)
三面加一起可能有4个小时以上,面完态度模糊,表示要横向pk,hc有限
4月
开始正儿八经写题了,自信心遭受打击
字节tiktok广告:
(1)自我介绍
(2)强化学习项目,有无碰到environment feedback latency过高的问题(肯定有啊,但是不知道怎么处理,只能胡诌了一个经验回放)
(3)联邦项目,解释加密过程(说了一下同态加密基本概念,担心追问,说我不是信安的,加密研究不深,我的文章偏accuracy优化)
(4)明显感觉技术不对口,开始问基础
(5)LR模型是否是一个线性模型(懵了,感觉有坑,想到linear regression,linear啥意思啊)(其实他问的应该是是否有非线性的决策边界,但我对决策边界这概念直接懵了)
(6)LR的决策边界是线性的,还是超平面,还是曲线(都有可能)
(7)LR模型里面wx+b拟合的是什么东西(所有样本发生概率的最大似然?当时已经懵了,说的是所有特征label的频率)
(8)判别模型是后验的还是先验的(这个没问题),机器学习指标(我说了accuracy和公平性指标,还有召回率,然后让讲讲ROC,我?讲道理,这个指标在本人领域根本不会出现)
(9)后验概率属于频率学还是贝叶斯(因为是通过贝叶斯方程和先验分布估出来的,我倾向于贝叶斯)
(10)频率学和贝叶斯的区别(这个概念没啥问题,前者认为估计量是确定的值,后者认为是一个分布)
(11)开始c++基础知识面(??合着我是全能选手啊,面面俱到)。什么是多态?(我的回答是多态是在不同继承关系的类对象,去调同一函数,发挥不同的作用)
(12)用母函数去调子函数,怎么知道调的是哪一个子函数(没懂他的意思,你调子函数,不用子函数的指针?)
(13)c++智能指针懂吧(我懵逼,c++三年没写过,面试后一拍脑袋,不就是那个new吗)
(14)开始python基础面。generator你肯定用的不多,你知道这个东西吗?(我:虽然没用过但我觉得这就是迭代器一类)
(15)你觉得他和普通的list在内存管理上有没有区别?(继续猜,既然是迭代器,就是没用到的只给一个指针,实际还在本地,用到的按需调入内存)
(16)你有过内存存不下数据集的经历吗?(我说没有,就算有,dataloader也是迭代器性质的,只在本地留一个指针,需要那个batch就拿进内存)
(17)讲一下分布式机器学习?(我讲了个spark,这个真没学过)
(18)算了,写题吧,给你两个元素相同,顺序不同的数组,用他们分别给对方排序(此时我整个人其实已经懵了,用一个数组给另一个排序,这是什么舍近求远的操作?估计是快排那一类的奇技淫巧,就先写了个快排,还有bug,后续需要不停地在两个数组之间交换元素,递归,其实我已经感觉被挂,不太想写了,大脑一片混乱)
(19)差不多了,今天就到这里吧,你是不是很久没写题了(1个多小时,每个方面的问题都答了个半吊子,不过这面试确实硬核),应该挂了。
#实习##腾讯##字节跳动##算法工程师#