端云芯算架构师/工程师



推荐人:雷祖志

研发类

深圳/上海/杭州

1人

5年及以上

硕士研究生

职位详情

岗位职责: 1、负责端云算法架构设计及落地: - 负责设计和优化端云结合的算法框架,保证系统的高性能、可扩展性和可靠性; - 结合云计算资源特性,设计支持大规模数据处理和高并发计算的算法架构; - 开发和优化适用于端云结合部署的算法,包括机器学习、深度学习、数据分析等算法; - 监控算法在云端运行的性能,进行调优以降低计算成本和延迟; - 跟踪云端算法架构和云计算领域的最新技术,推动技术创新。 2、负责 芯算算法架构设计及落地: - 负责芯片架构与算法的协同设计和优化,确保硬件设计与算法需求高度匹配; - 针对特定应用场景,优化算法以适应芯片硬件特性; - 负责流片过程中的效果验证; - 负责芯片与算法的系统集成,确保功能与性能达标; - 跟踪芯算一体领域的前沿技术,推动技术创新。 任职要求: 1、硕士及以上学历; 2、 工作年限,五年以上; 3、 熟悉云计算平台(如AWS、Azure、阿里云、Google Cloud等)及其服务(如EC2、S3、Lambda等); 4、精通Python、C++等编程语言,精通Torch,tensorflow等深度学习框架,具备扎实的算法实现和优化能力; 5、熟悉分布式计算框架(如Spark、Hadoop)和容器化技术(如Docker、Kubernetes); 6、A/H系列节点部署经验,NVSwitch/NCCL搭建经验; 7、 多节点Kubernetes GPU调度策略配置经验; 8、 掌握Linux驱动管理、CUDA兼容性矩阵管理; 9、了解机器学习、深度学习、图像处理算法算法,有相关项目经验者优先; 10、具备良好的沟通与团队协作能力; 11、具备较强的学习与创新能力,能快速掌握新技术。 优先条件: • 有芯片设计、算法优化或芯算一体项目经验者优先; • 有LLM推理框架开发经验(如vLLM/lmdeploy); • 有千亿参数MoE模型训练框架部署经验; • 具备国产显卡(昇腾/摩尔线程)部署经验。
【vivo内推】https://recruit.vivo.xyz/jobs/a23f14d5c20f1a9f3b1f8d1d2fa76337ffcc19750938f4d9f7f5b795ff74775cb3d4891ef46f2c347c43ef721e0c5be64884fa0bf8af1b4e22e04b87533a861d,点击链接查看职位详情,欢迎加入vivo
全部评论

相关推荐

Time line3.12 一面 hr面3.13 二面 技术面3.17 三面 技术面3.24 oc一面主要就是聊聊天,介绍公司基本情况以及薪资待遇(正常来说,这不应该三面么)二面1.简单介绍一下你自己2.拷打项目,几种常见卷积算法的优缺点3.写算子时有碰到bank conflict吗?为什么会发生bank confict以及如何解决?4.说一下CPU和GPU的架构5.说一下你对grid,block,thread的理解6.写算子时如何最大化地利用缓存?迭代一次的数据尽量符合L1的大小,整个程序的数据尽量符合L2的大小。(当时我的回答)7.你知道线程束分歧吗?(warp divergent 也叫线程束分化)8.手撕矩阵乘算子(当时我打开vscode,他看了我写的reduce以及conv2d,于是便叫我写一个矩阵乘)第一次技术面,有点紧张,在面试官的提示下顺利写出naive版本,然后说自己对后面的优化,以及如何确定最佳分块大小。过程中还问了blockDim.x和gridDim.x最大能开多少。反问环节三面感觉和二面差不多,主要也是拷打项目不同点:1.共享内存和cache的区别2.你了解Tensor core吗?它和CUDA core比加速矩阵乘谁更快?3.你了解Transformer吗?4.softmax算法在深度学习中的应用5.手撕softmax算子(有了经验后,十分顺利)反问环节最后祝大家都能顺利找到实习#面经##实习##算子开发##CUDA#
查看14道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客企业服务