字节 算法 一二三面 面经


一面:
1. QK的放缩因子
2. decoder的mask层是如何设计的
3. 为什么需要多头注意力
4. transformer的Position-wise Feed-Forward Networks为什么需要降维升维。
5. 过拟合、欠拟合怎么处理

笔试:[1,2,3,4,54,56,5] 不能相隔偷,最多能投多少

二面:
1.encoder层介绍一下。
2.dropout介绍一下,训练和推理有什么区别。
3.dropout、normalazation、激活函数的先后顺序。


三面:
先笔试:
括号匹配,三数之和组合数
1.MMoE伪代码
2.attention,相关系数,交叉熵伪代码
3.loss weight调参的经验
4.attention的踩坑经验
5.不确定性加权怎么做,为什么不work。

许愿HR面!!许愿!!!



#字节跳动秋招提前批##面经##字节跳动#
全部评论
希望楼主成功
1 回复 分享
发布于 2021-08-23 16:58
想问问hr面会问些啥
点赞 回复 分享
发布于 2021-08-24 13:28
哪个bg
点赞 回复 分享
发布于 2021-08-26 00:22
谈钱了吗
点赞 回复 分享
发布于 2021-08-26 11:57
想请教下博主,算法岗笔试是4道编程吗?
点赞 回复 分享
发布于 2021-08-27 14:38

相关推荐

威猛的小饼干正在背八股:挂到根本不想整理
点赞 评论 收藏
分享
我即大橘:耐泡王
点赞 评论 收藏
分享
2 26 评论
分享
牛客网
牛客企业服务