字节AML凉经

一面:
1. 项目(MPS, 训练内存, 调度策略, 时分复用和空分复用)
2. LLM推理有什么主要瓶颈
3. LLM推理主要的优化技术
4. page attention
5. orca迭代级请求调度
手撕: 反转链表

二面:
1. 项目(MPS, GPU占用率指标)
2. C++ 数组下标越界了会报什么错
3. 怎么Debug, linux环境下如何定位错误
手撕: LRU cache
全部评论
好难
点赞
送花
回复
分享
发布于 04-28 11:57 北京

相关推荐

头像 会员标识 头像
04-27 20:48
已编辑
腾讯_TEG_后台开发
理想汽车 算子开发 35*14-16 硕士211
点赞 评论 收藏
转发
点赞 6 评论
分享
牛客网
牛客企业服务