百度提前批(直接开始二战) 高性能计算工程师一面面经

没想到吧兄弟们,直接开始二战了。捞了我就面呗~这回面的挺爽的。

点名表扬语音部门,面试至少感觉respect。

八股/经历

  1. 自我介绍:懂得都懂,开源+实习
  2. 讲了讲在字节的实习工作:大模型训练模拟器
  3. 根据这个他问了我TP PP DP都是什么,具体流程
  4. 如何根据TP PP的通信量进行取舍
  5. 问了量化相关,什么是per tensor,per channel,group wise
  6. 不同的量化方法之间的区别,为什么group wise能更加降低量化误差
  7. 不同的量化之间开销的区别,如何降低开销
  8. 你了解量化中的异常值吗,如何消除异常值(提到了下面三种方法
  9. 大模型量化方法介绍 gptq awq smoothquant都是什么
  10. 你了解kv cache量化吗 请讲讲kv cache量化
  11. 你知道flash attn吗,flash attn为什么会加速?
  12. flash attn 1 2 之间有什么区别
  13. flash attn 每个Bc块的切分思路是什么,1 loop flash attn是怎么做的
  14. 你知道paged attention吗,思路是什么?
  15. 大模型prefill 阶段和 decoding阶段的区别是什么,为什么会有这种区别
  16. prefill阶段的flash attn在decoding阶段会有什么问题,decoding阶段的attn方法(flash decoding
  17. 讲讲flash decoding的思路。
  18. 讲到了具体组件:RmsNorm是如何实现的
  19. 如果现在你要优化一个cuda kernel 你的优化思路是什么?
  20. 现在有一个conv2d 它的输入CWH是[64, 64, 128] 卷积核大小是3x3 它的输出大小是[128, 64, 128]。问它的参数量是多大,计算flops是多大(flops算晕了没算出来
  21. 如果你现在要用cpu做算子优化,你知道该怎么做吗(把我知道的avx512都说了,笑死
  22. c++ 八股 智能指针

做题

  1. cuda layernorm

--------------------------------------------------

后续,秒过了。好好好好好好好好好,你比paddle大大滴好

#我的简历长这样##夸夸我的求职搭子#
全部评论
前排预告,这周五面快star。更新面经攒人品
6 回复 分享
发布于 2024-07-24 19:16 河北
公司***没关。定位去河北了
点赞 回复 分享
发布于 2024-07-24 19:16 河北
还得是尹神
点赞 回复 分享
发布于 2024-07-24 19:16 北京
收藏了,感谢大佬
点赞 回复 分享
发布于 2024-07-24 19:56 北京
大佬拿offer了吗
点赞 回复 分享
发布于 2024-07-24 21:31 上海
这是社招吗
点赞 回复 分享
发布于 2024-07-24 21:54 北京
请问面试是hr加微信约的吗?
点赞 回复 分享
发布于 2024-07-25 11:28 江苏

相关推荐

头像
2024-12-31 08:28
已编辑
北京大学 嵌入式软件开发
1. C++11有什么新特性?2. 函数有哪些常见的传参方式,有何区别?3. 指针和引用有什么区别?4. 指针常量和常量指针有何区别?5. 常见的内存泄漏发生场景有哪些?6. 常见的内存泄漏检测工具?7. 虚拟内存和物理内存的区别?8. 内存空间有哪些区域?分别是做什么的?9. 段页式内存管理有何优点?10. 说一下智能指针?11. 内联函数是什么?和宏有何区别?它有什么优缺点?什么情况不能内联?12. 说一下多态的底层原理?为什么要有多态,直接静态重写不好吗?13. C++空类的大小是多少?如果空类内含有虚函数,类的大小又是多少?14. 讲讲内存对齐?15. 虚函数可以是模板函数吗?16. 虚函数可以内联吗?17. 32位Linux系统的寻址空间是多大?进程能申请的内存有这么大吗?18. Linux系统中进程默认栈空间是多大?如何修改?19. Linux系统中调试崩溃问题的流程是?20. 栈溢出一般是由哪些原因导致?21. Static关键字有什么用?static变量修饰全局、函数内和类内变量时,分别在什么时候进行初始化?22. 初始化列表有什么好处?哪些成员变量必须通过初始化列表初始化?23. 什么是右值引用?说一下什么是移动语义及使用场景?24. Malloc/free和new/delete有什么区别?25. Vector和List有什么区别?讲一下vector动态扩展的原理?26. Vector动态扩展时,编译器为什么不先判断一下原有空间后面的内存是否空闲,如果空闲,直接在后面的内存空间继续分配空间?(从内存池角度回答)27. Unordered_map和map,unordered_set和set,分别有什么区别,它们的底层数据结构是什么?28. priority_queue优先级队列的底层数据结构是什么?操作的时间复杂度是什么?29. 红黑树与AVL树有什么区别?与堆有什么区别?与跳表有什么区别?30. 如果让你用一维数组模拟一个大根堆,你怎么实现?问题答案已经整理到专栏中了,关注我分享更多知识。   http://daxprogram.com
点赞 评论 收藏
分享
评论
17
64
分享
牛客网
牛客企业服务