辉羲智能 NPU算子开发实习生 面经

Time line
3.12 一面 hr面
3.13 二面 技术面
3.17 三面 技术面
3.24 oc

一面
主要就是聊聊天,介绍公司基本情况以及薪资待遇(正常来说,这不应该三面么)

二面
1.简单介绍一下你自己
2.拷打项目,几种常见卷积算法的优缺点
3.写算子时有碰到bank conflict吗?为什么会发生bank confict以及如何解决?
4.说一下CPU和GPU的架构
5.说一下你对grid,block,thread的理解
6.写算子时如何最大化地利用缓存?
迭代一次的数据尽量符合L1的大小,整个程序的数据尽量符合L2的大小。(当时我的回答)
7.你知道线程束分歧吗?(warp divergent 也叫线程束分化)
8.手撕矩阵乘算子(当时我打开vscode,他看了我写的reduce以及conv2d,于是便叫我写一个矩阵乘)
第一次技术面,有点紧张,在面试官的提示下顺利写出naive版本,然后说自己对后面的优化,以及如何确定最佳分块大小。过程中还问了blockDim.x和gridDim.x最大能开多少。
反问环节

三面
感觉和二面差不多,主要也是拷打项目
不同点:
1.共享内存和cache的区别
2.你了解Tensor core吗?它和CUDA core比加速矩阵乘谁更快?
3.你了解Transformer吗?
4.softmax算法在深度学习中的应用
5.手撕softmax算子(有了经验后,十分顺利)
反问环节

最后祝大家都能顺利找到实习

#面经##实习##算子开发##CUDA#
全部评论
我为大佬打call
1 回复 分享
发布于 03-27 15:03 四川
1 回复 分享
发布于 03-27 15:08 四川
1 回复 分享
发布于 03-31 21:25 四川
点赞 回复 分享
发布于 03-27 15:33 四川

相关推荐

推荐人:雷祖志研发类深圳/上海/杭州1人5年及以上硕士研究生职位详情岗位职责: 1、负责端云算法架构设计及落地: - 负责设计和优化端云结合的算法框架,保证系统的高性能、可扩展性和可靠性; - 结合云计算资源特性,设计支持大规模数据处理和高并发计算的算法架构; - 开发和优化适用于端云结合部署的算法,包括机器学习、深度学习、数据分析等算法; - 监控算法在云端运行的性能,进行调优以降低计算成本和延迟; - 跟踪云端算法架构和云计算领域的最新技术,推动技术创新。 2、负责 芯算算法架构设计及落地: - 负责芯片架构与算法的协同设计和优化,确保硬件设计与算法需求高度匹配; - 针对特定应用场景,优化算法以适应芯片硬件特性; - 负责流片过程中的效果验证; - 负责芯片与算法的系统集成,确保功能与性能达标; - 跟踪芯算一体领域的前沿技术,推动技术创新。 任职要求: 1、硕士及以上学历; 2、 工作年限,五年以上; 3、 熟悉云计算平台(如AWS、Azure、阿里云、Google Cloud等)及其服务(如EC2、S3、Lambda等); 4、精通Python、C++等编程语言,精通Torch,tensorflow等深度学习框架,具备扎实的算法实现和优化能力; 5、熟悉分布式计算框架(如Spark、Hadoop)和容器化技术(如Docker、Kubernetes); 6、A/H系列节点部署经验,NVSwitch/NCCL搭建经验; 7、 多节点Kubernetes GPU调度策略配置经验; 8、 掌握Linux驱动管理、CUDA兼容性矩阵管理; 9、了解机器学习、深度学习、图像处理算法算法,有相关项目经验者优先; 10、具备良好的沟通与团队协作能力; 11、具备较强的学习与创新能力,能快速掌握新技术。 优先条件: • 有芯片设计、算法优化或芯算一体项目经验者优先; • 有LLM推理框架开发经验(如vLLM/lmdeploy); • 有千亿参数MoE模型训练框架部署经验; • 具备国产显卡(昇腾/摩尔线程)部署经验。【vivo内推】https://recruit.vivo.xyz/jobs/a23f14d5c20f1a9f3b1f8d1d2fa76337ffcc19750938f4d9f7f5b795ff74775cb3d4891ef46f2c347c43ef721e0c5be64884fa0bf8af1b4e22e04b87533a861d,点击链接查看职位详情,欢迎加入vivo
投递谷歌等公司10个岗位
点赞 评论 收藏
分享
评论
3
收藏
分享

创作者周榜

更多
牛客网
牛客企业服务