推理部署优化/高性能开发 春招总结-1

腾讯
    一面
        1. Tensorrt-LLM, AGI , VLLM源代码区别
        2. 为什么要有continue batch
        3. fastllm.cpp 的源代码
        4. yolo加速
        5. Python 计算密集型使用多进程还是多线程
        6. C++继承怎么实现的
        7. 最大子数组之和
    二面
        1. 求比特位中1个个数
        2. 编译时运行
        3. VLLM ,PageAttention
        4. Cuda 内存模型介绍
        5. 使用triton 实现 PageAttention
    二面挂#金三银四,你有感觉到吗#
#春招提前批,你开始投了吗#
全部评论
佬,面的啥部门呀
1 回复 分享
发布于 04-02 00:17 广东
请问应该投什么岗位呢这个方向
1 回复 分享
发布于 04-13 20:00 浙江
佬,triton实现pagedattention是手撕吗
点赞 回复 分享
发布于 04-04 14:12 广东
mark
点赞 回复 分享
发布于 04-15 21:56 湖北
大佬自学吗还是课题组方向
点赞 回复 分享
发布于 04-28 08:48 黑龙江
mark
点赞 回复 分享
发布于 05-07 21:13 湖南
mark
点赞 回复 分享
发布于 05-07 21:13 湖南
大佬,这个岗位投递名字是啥啊
点赞 回复 分享
发布于 06-02 15:36 湖北
mark
点赞 回复 分享
发布于 06-20 00:20 湖北
面得这么恐怖吗
点赞 回复 分享
发布于 09-22 20:53 浙江

相关推荐

5 62 评论
分享
牛客网
牛客企业服务