Caramel_Macchiato level
获赞
174
粉丝
30
关注
2
看过 TA
866
哈尔滨工业大学
2025
算法工程师
IP属地:浙江
暂未填写个人简介
私信
关注
#互联网回暖,字节要招4000+人# 刚告诉我简历又被锁了,估计又要打复活赛了。这下面试爷是不虚了,爱过不过去****,反正过不过也不在于我,继续拷打字节。就当面着玩了以后,趁还记得一些把之前面试的面经写一下回馈给牛油们,我也不算浪费时间。7.22 某缺人部门海招ByteIntern,当时很多人都接到电话了,当时我也没面试过寻思就当练手了。后来才知道字节一直保留面评,当时要是知道就不面了。这一面个人觉得是最难的。Transformer经典八股:·Transformer结构 ·手写自注意力然后问我Q,K,V的线性变换矩阵能不能共享权重,这个我现在也不知道能不能,问同学说能问GPT4说不能。·为什么÷sqrt(dk) ·多分类损失函数 ——交叉熵;交叉熵里每一项的意义是什么?·讲一下Adam优化器的原理以及优化过程·八股记不得了,手撕lc84,面了快40次唯一一个考hard的8.5 第二面(ByteIntern一面)还是ByteIntern,当时是在官网随便投的,没想到被看到了。部门是做AI评估音乐的,一面面试官说因为看到我简历上钢琴10级适合以及我本来就是做声学AI算法的感觉非常合适。·问了点声学的知识,可能参考意义不大。梅尔频谱怎么来的,MFCC怎么来的,他们什么关系·还是Transformer,自注意力。问了一个cross attention,我当时都没听说过这啥,面完赶紧补习了一下,后来百度二面也问了。·BERT和Transformer区别·TTS相关的,FastSpeech和Tactorn区别。这个不是做语音合成、语音大模型相关的应该也没啥参考的·手撕,手写一个带通滤波器对特定频段的声音加强;最长无重复子字符串8.8 第三面(ByteIntern二面)没太问八股·怎么评价生成式模型生成的音乐(我项目里有一个用diffusion生成音乐的)的好坏·KL散度·Linux熟悉吗?我说我就会cd mkdir rm -rf剩下的不记得了·手撕,括号字符串是否合法,栈秒了然后告诉我要加面,我可去你...接下来的两轮技术面一轮是业务场景题,一轮是一个酷似《狂飙》里蒋天的人给我讲了一堆入职之后的事就没了,然后是HR面,就这么ByteIntern前后面了一个月后顺利“通过”了。期间我还面了网易的推荐算法实习,也过了,但是因为这个ByterIntern已经告诉我准备入职了我就推掉了....然后offer审批了两周,字节HR打电话告诉我说那边说因为这是能转正的实习,看的表现符合预期但没有超出预期,所以没审核通过。我可阐释你的梦啊,生怕我转正是吧。ICASSP截稿9.9,正好实验做完了,那几天光速写了一篇,反正就4页,快得很。然后9.3被正式批捞了,一个叫用户增长(User Growth)的部门,我也不知道干啥的,去校招网站看会数据结构机器学习深度学习这些就行,那就面呗。HR加我微信问:"同学我看你都六面了啊而且面评也不错的,怎么回事啊?"是啊,怎么回事啊,你们企业传统艺能你都不知道吗?不过这回效率倒是快,秒锁我简历,我本来正和国际音乐那边的聊得不错准备内推我,结果发现已经被用户增长锁了,锁完就约面。9.5 第七面(正式校招岗一面)估计是看我之前算法八股考差不多了,开始考我数据结构啥的了·知道哪些排序算法?时间复杂度都是多少·哪些是空间换时间的排序算法?·栈和堆的区别·泊松分布和γ分布的区别(?woc开始考数学了)·β分布和γ分布的关系·卡方分布和γ分布的关系·softmax公式·AUC,机器学习里样本不均衡怎么解决,二分类的话如果负样本过多对AUC有什么影响,sigmoid的平均值会怎么变·手撕,最大子数组乘积,lc1529.6第八面(正式校招岗二面)这面我了个大草啊,拷打半天数学。·线程和进程的区别(我草你就那么确定我学过OS吗,这真是我自己好奇自学的)·C语言里临时变量怎么存的,全局变量怎么存的,临时变量可以用指针指向吗?我就记得当时学CASPP的时候临时变量是放栈里全局变量是放堆里,栈里的物理地址总变我估计是不能用指针指的,我就这么说的。·手撕,给定先序遍历和中序遍历,输出后续遍历,递归秒了。然后面试官直接放弃繁文缛节了,开始我面试以来最汗流浃背的一小时:“我看你学数学的,我得看看你数学基础怎么样”这一部分参考意义其实不小,我PDD二面也考了贝叶斯估计,现在偏机器学习算法岗的岗位会有考·多项式方程,怎么写程序求解? 直接懵了,这我把大二学数值代数的知识回想起来了,最后说出来牛顿迭代法,记忆恢复20%。好在没让我动手实现一个·抛硬币,直到抛出两次正面停止,预计要抛多少次(求期望)。本来我信誓旦旦的写了一个求期望的级数,准备用级数求和再不济用高中的错位相减算,结果写到5次的时候汗流浃背了,发现这个表达式太难写了。最后努力回忆起上辈子的记忆用马尔科夫状态转移算求出来了。答案是6次,具体怎么算牛油们查一下就找到了,挺经典的题。·抛10次硬币,4次正面,6次反面,求抛出正面的概率p的极大似然估计。我上早八,我都多少年没算过这东西了,开始边胡诌边说了,我说我记得这玩意是无偏估计....诶,无偏估计,那这东西算出来最后应该是2/5...最后倒果为因,从结果倒推推出来了极大似然估计的式子算出来了9.11第九面(正式校招岗三面)·lc31 下一个排列·二分类问题的损失函数。 为什么是BCE?表达式是什么,为什么是这个形式?答:因为交叉熵是凸的,好优化;另外交叉熵和KL散度之间差了个目标分布的熵,优化BCE就是减小KL散度,让预测分布和目标分布差距减小。面试官连连称好虽然没有luan用表达式一开始写完少写了个符号,提醒我之后写出来了。9.12因风格不融洽(nm$l),三面挂,我去问了一下之前国际音乐的HR能不能给我推进进程,她告诉我发现我又被锁简历了,这次是机器学习算法岗的,哥们又要打复活赛了。这回爱过不过,全当去给牛油们更新热乎的面经了。
查看17道真题和解析
0 点赞 评论 收藏
分享
关注他的用户也关注了:
牛客网
牛客企业服务