微步在线 机器学习算法工程师 二面面经

地狱一样的理论问询,今年秋招最难的一场……

数学问了中心极限定理,大数定理,Γ分布和κ分布关系……

机器学习问了特征选择,特征归一化,马尔科夫链,gibbs采样,集成学习,选择性偏差,决策树并行计算,xgboost和adaboost样本权重……

深度学习问了卷积原理,梯度传播稳定性,BN本质,torch和tensorflow的图理论……

大模型问了很多工程上的问题,出现loss spike啦,波峰波谷啦,训练到一半出现异常值啦怎么处理……
还有很多理论上的,flash attention v1/v2/v3是怎么解决访存瓶颈的,位置编码外推,从0开始训长文本模型,4D并行通信开销,zero,megatron和deepspeed应用场景,MLA的实践问题……

GPU集群问了架构方式,k8s,坏点检测,负载均衡……

python问了线程锁,线程池,资源分配,垃圾回收……

以上只是我听的懂的问题里的一部分,还有好多已经忘记的和根本没听过的概念

感觉微步确实很看重理论基础,应该是相当技术导向的,面试官人也很不错,只是感觉我答的不太好,对我有点无语hh。

--------------------------------------------------------------------------------------------------------------------------

本来准备说凉经的,但刚写到这被hr告知过了二面了,感谢面试官大哥
全部评论
这难度真绝了
2 回复 分享
发布于 08-22 23:24 黑龙江
太狠了吧😅
1 回复 分享
发布于 08-22 12:14 广东
地狱难度啊这
点赞 回复 分享
发布于 08-22 15:10 陕西
话说微步是什么公司啊
点赞 回复 分享
发布于 08-22 15:11 陕西

相关推荐

12-14 15:22
门头沟学院 C++
647、回文子串://动态规划解法:布尔类型的二维dp数组        //dp[i][j]:区间范围[i,j](左闭右闭)的子串是否是回文子串,如果是dp[i][j]为true,否则为false。        //递推公式:主要分为s[i]和s[j]相等和不相等的情况        //不相等时:dp[i][j] = false;        //相等时:        //1、i=j时为单个字符,所以dp[i][j] = true        //2、j-i=1时为两个相同的字符,所以dp[i][j] = true        //3、看dp[i][j]是否为true,可以由dp[i+1][j-1]推导出来        //初始化:全初始化为false,后面再去判断更新        //遍历顺序:由于dp[i][j]要由dp[i+1][j-1]推导出来,所有i从大到小,j从小到大遍历(因为是字符串区间,所以j一定要大于i)516、回文子序列://回文子序列不要求连续        //dp[i][j]:区间范围[i,j](左闭右闭)的子串的最长回文子序列        //递推公式:主要看s[i]和s[j]是否相等        //如果相等,则dp[i][j] = dp[i+1][j-1] + 2;//注意单个字符和两个字符的情况        //不相等,则dp[i][j] = max(dp[i+1][j], dp[i][j-1]);        //初始化:全初始化为0;        //遍历顺序i--,j++
点赞 评论 收藏
分享
评论
8
16
分享
牛客网
牛客企业服务