百融云创ai infra面经(已口头offer)
timeline:
2月10日一面
2月13日二面(leader面)
2月14日三面
2月24日四面(hr面)
2月25日谈薪,口头offer(跟hr提了几天时间考虑要不要接)
面试提问的一些大概问题(针对项目的问题略过。。。):
能说一下reduce类算子有哪些优化方案吗?
对于reduce类算子,考虑shape为[M, N],对于M非常大怎么优化?对于N非常大怎么优化?
了解sglang和vllm吗?
vllm采用了哪些优化方案?PageAttention的实现思路是怎样的?
vllm你觉得哪些方面可以进一步优化?
说说flashattention的原理
openMP外层循环开了四个线程,在内层循环可以开大于四个线程的循环吗?
有哪些原子操作?锁的原理?
说说CUDA的内存模型
CUDA的cache是可配置的吗?
手撕:实现LRU
还有一些其他问题不大记得了。。