抖音电商 训推岗凉经
bg
一段芯片厂推理框架开发实习
一个推理框架开发的项目
一面
一面的面试官是搞算法的,可能对推理相关的内容了解的不多,主要是针对CUDA的内容问的,比如内存模型,加速方法等,不算深入。顺便还考了一个softmax的CUDA手撕。
其他的就是针对简历上提到的一些工作进行了提问,因为面试官本身也了解不深入,所以算是给他回答一些疑惑。
手撕除了上面说到的CUDA,还有LC19删除链表的倒数第N个节点。
二面
一开始就是对项目和实习进行了询问,属于聊天型的。
然后从简历出发,考了一些八股,flash attention、attention的计算复杂度,llama模型结构,为什么注意力分数计算要除以根号d,KV cache的压缩方法。
比较常规的八股,但是问的很浅,比如KV cache压缩方法中,我提到说知道MQA和GQA,然后也没深入问。还问到了分布式训练的内容,我提到说相关的论文都看过,但是没有实际经验。其实除了上面提到的八股,其他问题都是问我知不知道,无论知道还是不知道都没有再深入问。
面试官给提了两点建议:要实际跑一下分布式训练(我的大多数工作都是推理,训练只看过论文),然后要对tensorRT-llm熟悉(只深入看过vllm,tensorRT-llm确实了解的不多)。
手撕是LC215数组中的第K个最大元素。
本来以为秋招更看重的是基础,面试官给提的建议可以下来后慢慢学,没想到这两条建议实际上给判了死刑。在反问的时候面试官建议我投AML,想想也是很明显的暗示了。
HR反馈说面评都很不错,感觉还是岗位匹配度不够吧,通过反问猜到这个业务的HC应该不会多,可能更希望候选者能够尽可能的匹配,而我又没有训练的经验,因此挂了。其实说来应该还有一个原因,面试官提到目前的业务是一个正式工和一个实习生,面试开始的时候也问了我能不能实习的一些问题,感觉是比较缺马上能干活的人。
#字节跳动##面经##大模型推理##大模型训练#