推理部署优化/高性能开发 春招总结-1

腾讯
    一面
        1. Tensorrt-LLM, AGI , VLLM源代码区别
        2. 为什么要有continue batch
        3. fastllm.cpp 的源代码
        4. yolo加速
        5. Python 计算密集型使用多进程还是多线程
        6. C++继承怎么实现的
        7. 最大子数组之和
    二面
        1. 求比特位中1个个数
        2. 编译时运行
        3. VLLM ,PageAttention
        4. Cuda 内存模型介绍
        5. 使用triton 实现 PageAttention
    二面挂#金三银四,你有感觉到吗#
#春招提前批,你开始投了吗#
全部评论
佬,面的啥部门呀
2 回复 分享
发布于 2024-04-02 00:17 广东
大佬自学吗还是课题组方向
1 回复 分享
发布于 2024-04-28 08:48 黑龙江
请问应该投什么岗位呢这个方向
1 回复 分享
发布于 2024-04-13 20:00 浙江
面得这么恐怖吗
点赞 回复 分享
发布于 2024-09-22 20:53 浙江
mark
点赞 回复 分享
发布于 2024-06-20 00:20 湖北
大佬,这个岗位投递名字是啥啊
点赞 回复 分享
发布于 2024-06-02 15:36 湖北
mark
点赞 回复 分享
发布于 2024-05-07 21:13 湖南
mark
点赞 回复 分享
发布于 2024-05-07 21:13 湖南
mark
点赞 回复 分享
发布于 2024-04-15 21:56 湖北
佬,triton实现pagedattention是手撕吗
点赞 回复 分享
发布于 2024-04-04 14:12 广东

相关推荐

 全程1h,项目穿插八股,最后手撕        1. 介绍项目    2. 项目亮点?(线程间交互的痛点,跨线程任务队列优化)    3. 你还知道哪些线程间通信的方式?(只答了共享内存)    4. TCP keep-alive机制    5. 增量式HTTP模块如何实现的?    6. 那再讲讲对HTTP协议,有什么认识?(答了Cookie和Session,项目2用到)    7. 项目2中的多用户高并发是如何实现的?    8. 你觉得解决多用户高并发场景的痛点是什么?(答了负载均衡,分布式,不熟悉)    9. 讲讲STL你最熟悉的地方(vector、string、迭代器思想)    10. 讲一下vector底层的扩容机制    11. 数组和链表访问元素的区别?新增和删除呢?    12. MySQL B+树,如何访问数据?    13. 讲到排序算法,最熟悉哪一个?(快排、归排、堆排序、冒泡 )    15. 哪些是稳定的?哪些是不稳定的?    14. 拷打 快排:实现原理?什么情况下不适合用快排?用哪种替代合适?    15. C++ std::sort底层实现【手撕】    1. SQL:一个商品数量表,[id, quantity],求相同id商品的数量和(SQL太久没写,只讲了思路:先group by id,再用SUM聚合)        2. 给一个正整数数组和一个target,求 和大于等于target的最短子数组的长度。拓展:如果有负数呢?
查看18道真题和解析
点赞 评论 收藏
分享
评论
7
87
分享

创作者周榜

更多
牛客网
牛客企业服务