字节跳动算法工程师一面(个人第7面)

2024/11/08

1.自我介绍
2.围绕项目提问

手撕题:
3.如何使用rand5来实现rand7
4.实现一个多头注意力机制。

大模型八股:
5.注意力计算时,为什么需要除以缩放系数?
6.具体到多头注意力的计算中,掩码是如何加入的?(加性掩码,负无穷表示masked,0表示不masked)
7.全参数微调和lora的区别
8.LSTM和transformer的区别,transformer的优势?
9.deepspeed的zero1,zero2和zero3都是什么?
10. deepspeed和Megatron之间的差异是什么?
11.为什么大量使用decoder而不是encoder?

已过,已约二面。#字节求职进展汇总##字节复活赛##字节##哪个瞬间让你对大厂祛魅了?#
全部评论
传奇耐面王
点赞 回复 分享
发布于 2024-11-15 13:33 广东

相关推荐

头像
03-10 11:27
已编辑
门头沟学院 Java
📍面试公司:字节跳动👜面试岗位:后端开发📖面试问题:1. 自我介绍2. 开源经历都做了什么3. 项目里的延时任务怎么用的4. 定时任务呢5. 分布式锁怎么实现6. 如果锁过期了导致其它节点也执行定时任务怎么办(redission的看门狗,续期。或者不给锁设置过期时间,并将锁的value设置为节点ID,其它线程拿到锁的时候判断一下value是不是自己的ID,如果不是就不执行定时任务)7. volatile具体是怎么保证可见性和指令重排序,禁止指令重排序有什么实际的例子吗,具体是怎么起作用的(单例模式双重校验锁)8. synchronized又是怎么保证可见性的9. 写代码,两个线程分别打印奇数和偶数10. 给了一个SQL题,有id,type, createtime,name四个字段。建立了一个联合索引(type, createtime, name)。select * from table where type = 1 and createtime > xxx and name = %xxx%。怎么走索引。name = xxx%呢11. 又给了一个sql题,有id 和balance两个字段。A给B转账,怎么实现。12. 如果与此同时,B也在给A转账呢,两个事务会发生什么情况13. 有一个存储了几百万个电话号码的文件,怎么找到重复的电话号码(哈希表,位图,字典树)14. 算法题,最长公共子序列 15. 反问🙌面试体验:事后复盘发现问题还是比较少的,但是一共面了70分钟。。。#软件开发笔面经#
点赞 评论 收藏
分享
评论
8
20
分享

创作者周榜

更多
牛客网
牛客企业服务