怎么还有4面,是star吗
点赞 评论

相关推荐

中电信人工智能公司 大模型推理加速工程师实习生1. vllm sglang 有什么区别?sglang相对于vllm有什么好的?sglang为什么更适配推理这类的llm?dpskr1了解吗?和基座llm有什么区别?假如要魔改vllm,可以怎么做?2. Cuda算子开发经验,性能对比过吗?3. 大模型量化算法原理没问(感觉默认我懂)问有没有实际部署过?有没有看过autoawq的git库?4. Clip原理,clip推理流程了解吗?(简历里写了解过一些cv mllm方向)5. 实习经历介绍,实现的算子性能如何?常见大模型算子优化思路有哪些?(访存优化,并行优化)6. Ascend CANN MindIE框架有哪些组成?7. 场景1:V100显存多少,Dpsk Qwen 32B int8量化能部署吗?怎么部署?(紧张了,int8说2比特位…)8. 场景2:并发场景下怎么测试最大并发数,需要关注哪些指标?(答的不好)(bsz,latency 我回答的gpu利用率显存这些……面试官提示了从用户角度,我脑子没转过来)(指标含义没问,默认我懂)9. 场景3: vllm怎么去支持自研模型?面试官的建议:LLM有训练有推理,我们这个路子更偏向实现算法,加速算法。同样是attn,后端如何实现,如何更快。需要对算法有一定了解,对工程能力要求也挺高。我了解但是不够深入,实践经验较少。更深入去看vllm源码,应用层面怎么去调用算子,底层层面算子怎么实现的,怎么去实现更高性能算子(还提到可以从汇编层面出发)。关于暑期:电信(或者说国企)集团有统一的校招流程,需要投简历做笔试再分发简历到用人部门,没有直接内部转正的。个人感受:国企面试还是比较温和的,面试老师给我的感觉也是,知道你这个地方不会了,能力到这了,就不会再问了。呜呜呜,大厂全聚德的小垃圾(我)尸体暖暖的~#牛客AI配图神器#
12.11:补后续:hr说拉垮的点,没论文,实习时间短,不是大厂,内容垃圾不深入……
查看9道真题和解析
点赞 评论 收藏
分享
正在热议
更多
牛客网
牛客企业服务