牛客464628842号

2024-04-01 10:02 中国科学院大学 C++

关注

推理部署优化/高性能开发春招总结-1

腾讯
    一面
        1. Tensorrt-LLM, AGI , VLLM源代码区别
        2. 为什么要有continue batch
        3. fastllm.cpp 的源代码
        4. yolo加速
        5. Python 计算密集型使用多进程还是多线程
        6. C++继承怎么实现的
        7. 最大子数组之和
    二面
        1. 求比特位中1个个数
        2. 编译时运行
        3. VLLM ，PageAttention
        4. Cuda 内存模型介绍
        5. 使用triton 实现 PageAttention
    二面挂

#金三银四，你有感觉到吗#
#春招提前批，你开始投了吗#

全部评论

推荐最新楼层

草帽小路飞

门头沟学院 C++

佬，面的啥部门呀

1 回复分享

发布于 2024-04-02 00:17 广东

广东环境保护工程职业学院算法工程师

请问应该投什么岗位呢这个方向

1 回复分享

发布于 2024-04-13 20:00 浙江

四川大学 Java

大佬自学吗还是课题组方向

1 回复分享

发布于 2024-04-28 08:48 黑龙江

石家庄石门实验学校深度学习

佬，triton实现pagedattention是手撕吗

点赞回复分享

发布于 2024-04-04 14:12 广东

武汉大学 Java

mark

点赞回复分享

发布于 2024-04-15 21:56 湖北

中南大学 C++

mark

点赞回复分享

发布于 2024-05-07 21:13 湖南

中南大学 C++

mark

点赞回复分享

发布于 2024-05-07 21:13 湖南

喜欢编程的番茄

门头沟学院后端

大佬，这个岗位投递名字是啥啊

点赞回复分享

发布于 2024-06-02 15:36 湖北

不讲道理的咸鱼躺平了

华中科技大学 C++

mark

点赞回复分享

发布于 2024-06-20 00:20 湖北

浙江大学 Java

面得这么恐怖吗

点赞回复分享

发布于 2024-09-22 20:53 浙江

02-16 18:10

吉林大学 Java

某中厂ai编译器一面凉经

1.自我介绍2.项目介绍3.说说项目里面内存管理优化的实现4.有没有看过一些开源项目的内存管理的实现。答：没有，只会暴力实现。5.说说你所实现的算子融合和冗余算子消除。6.说说mlir里面的Op，region，block答：不会，瞎蒙了一下，类比于llvm里面相关的概念，说了一下它们表示的范围不同7.说说triton。答：简易地说了一下triton从python kernel到cubin可执行文件的lower过程。8.看你简历上写了熟悉编译原理，说说你了解的编译原理。9.说说你所了解的循环优化的策略。答：不会10.说说为啥要有ssa，它的好处。11.了解常见的大语言模型吗？答：只知道基本概念，...

查看14道真题和解析

点赞评论收藏

分享

03-05 21:23

门头沟学院 C++

旷视科技 - 二面凉经

感觉是对于大模型推理的batch问题上回答的面试官不是很满意，反正没有后续联系了1. 自我介绍2. 直接聊项目3. 聊vllm的特性4. 转到聊为什么batch能提高吞吐量，我的回答他不是很满意5. 做了一道合并有序链表，然后围绕题目突然展开聊操做系统底层。真难啊找个实习

查看6道真题和解析

点赞评论收藏

分享

02-26 22:51

门头沟学院 C++

百融云创ai infra面经（已口头offer）

timeline:2月10日一面2月13日二面（leader面）2月14日三面2月24日四面（hr面）2月25日谈薪，口头offer（跟hr提了几天时间考虑要不要接）面试提问的一些大概问题（针对项目的问题略过。。。）：能说一下reduce类算子有哪些优化方案吗？对于reduce类算子，考虑shape为[M, N]，对于M非常大怎么优化？对于N非常大怎么优化？了解sglang和vllm吗？vllm采用了哪些优化方案？PageAttention的实现思路是怎样的？vllm你觉得哪些方面可以进一步优化？说说flashattention的原理openMP外层循环开了四个线程，在内层循环可以开大于四个线...

查看14道真题和解析

点赞评论收藏

分享

02-27 09:08

已编辑

华为_研发经理

25届春招：华为AI算子\大模型开发开发招聘！南京(优先)，HC充足

方向1：公司目前最火的算子开发赛道，帮助客户更快用好华为昇腾算力，推进昇腾算子开发生态，加速昇腾产品进入千行百业；基于昇腾CANN架构，构建高性能的NPU加速引擎解决方案。（核心竞争力，对标英伟达cuda）方向2：负责大模型与端云协同能力部署，实现端侧实时流畅的语言与视觉大模型加速计算。（不接触大模型，都不好意思说自己是搞AI的）【任职要求】业务技能要求：1、25届应届生；2、有较强的学习能力和编码能力；3、有良好的表达能力和沟通能力，注重团队合作，主动担当。专业知识要求：1、 C/C++或Python编程基本功扎实， 有较强的代码分析与实现能力；2、了解深度学习及神经网络加速的相关概念、有Caffe/Tensorflow/Pytorch等深度学习框架应用经验者优先。【岗位优势】1、多地域团队年轻，，规模化扩招50+！工作氛围轻松、活跃！#牛客AI配图神器#2、新业务，当下风口业务，舞台够大，可以大展拳脚，可达到的高度不设限，也容易出成绩。有意者可添加 微信联系方式

投递海思半导体等公司10个岗位

点赞评论收藏

分享

02-27 17:40

博云_AIOS产品技术部_云原生AI实习工程师(实习员工)

字节跳动 - 测试开发 - 一面 - byteintern

#字节跳动# #面经#50分钟，有些记不起来的就不写了 日常来 自我介绍项目介绍 先问项目有什么亮点，挑一个讲一下。Python和Golang有什么区别？Golang中的协程为什么高效？agent执行一个请求的过程？(要答到底层去，dns、路由器、交换机，TCP/IP模型，答的不好，没有成体系，东一榔头西一榔头)tcp请求中如果有一个请求特别大被拆分了多个包且有的包丢失了，后续会发生什么？(答的不好，讲了keepalive和重发，不够)进程线程协程具体讲一下？用户态和系统态讲一下？(要问我底层，不会了)如何测试一个功能正确和完备？(没见过的八股，不会了)如何使用CI/CD构建自动化测试构建部署...

查看13道真题和解析

点赞评论收藏

分享

评论

7

83

招聘动态

26届实习生双选会报名开启

26届实习软件笔试必刷题单

汇丰科技中国

2025校园招聘

博乐科技

2025校园招聘

新毅东（北京）

2025春季校园招聘

联想

25届校招+26届实习

携程集团

25届校招+26届实习

石化盈科

2025届校园招聘

26届简历拷打辅导交流

快手

25校招&26实习进行中

全站热榜

更多

创作者周榜

更多

正在热议

更多

2074349次浏览 24239人参与

# 读研or工作，哪个性价比更高？ #

30509次浏览 399人参与

# 腾讯音乐26届实习 #

192969次浏览 1031人参与

# 牛友故事会 #

187616次浏览 3424人参与

# 讲讲我的真实离职原因 #

27369次浏览 194人参与

# 传音控股求职进展汇总 #

8709次浏览 65人参与

# 元戎现在香不香 #

66563次浏览 541人参与

# 歌尔求职进展汇总 #

48244次浏览 322人参与

# 德州仪器求职进展汇总 #

1773次浏览 23人参与

# 90后北漂现状 #

20507次浏览 186人参与

# 入职以后才知道的校招谎言 #

67892次浏览 422人参与

# 烟草笔面经互助 #

11936次浏览 162人参与

# 安克创新求职进展汇总 #

20689次浏览 204人参与

# 初创公司值得加入吗？ #

15110次浏览 113人参与

# 牛友打假中心 #

7088次浏览 282人参与

# 实习必须要去大厂吗？ #

75549次浏览 1130人参与

# 你上一次加班是什么时候？ #

40828次浏览 293人参与

# 如果公司给你放一天假，你会怎么度过？ #

10953次浏览 94人参与

# 24届营销人拿到了几个offer #

11845次浏览 102人参与

# 软开人，秋招你打算投哪些公司呢 #

72395次浏览 803人参与

# OPPO求职进展汇总 #

602800次浏览 4769人参与

# 如果不工作真的会快乐吗 #

89294次浏览 749人参与

牛客网
牛客企业服务