百融云创ai infra面经(已口头offer)

timeline:

2月10日一面

2月13日二面(leader面)

2月14日三面

2月24日四面(hr面)

2月25日谈薪,口头offer(跟hr提了几天时间考虑要不要接)

面试提问的一些大概问题(针对项目的问题略过。。。):

能说一下reduce类算子有哪些优化方案吗?

对于reduce类算子,考虑shape为[M, N],对于M非常大怎么优化?对于N非常大怎么优化?

了解sglang和vllm吗?

vllm采用了哪些优化方案?PageAttention的实现思路是怎样的?

vllm你觉得哪些方面可以进一步优化?

说说flashattention的原理

openMP外层循环开了四个线程,在内层循环可以开大于四个线程的循环吗?

有哪些原子操作?锁的原理?

说说CUDA的内存模型

CUDA的cache是可配置的吗?

手撕:实现LRU

还有一些其他问题不大记得了。。

全部评论
base是哪里?
点赞 回复 分享
发布于 02-28 12:20 北京
咋不去好未来呢
点赞 回复 分享
发布于 03-01 15:25 陕西

相关推荐

Momenta 开发 38k*14(985硕士), 38K(985硕士), 44K*14(双一流), 35K*14(普通硕士), 30K(本科211), 30K*14(本科211), 32K*14(985硕士), 32K(985硕士), 30K(硕士211) 985硕士, 985硕士, 双一流, 普通硕士, 本科211, 本科211, 985硕士, 985硕士, 硕士211
点赞 评论 收藏
分享
评论
2
9
分享

创作者周榜

更多
牛客网
牛客企业服务