推理部署优化/高性能开发 春招总结-1

腾讯
    一面
        1. Tensorrt-LLM, AGI , VLLM源代码区别
        2. 为什么要有continue batch
        3. fastllm.cpp 的源代码
        4. yolo加速
        5. Python 计算密集型使用多进程还是多线程
        6. C++继承怎么实现的
        7. 最大子数组之和
    二面
        1. 求比特位中1个个数
        2. 编译时运行
        3. VLLM ,PageAttention
        4. Cuda 内存模型介绍
        5. 使用triton 实现 PageAttention
    二面挂#金三银四,你有感觉到吗#
#春招提前批,你开始投了吗#
全部评论
佬,面的啥部门呀
3 回复 分享
发布于 2024-04-02 00:17 广东
大佬自学吗还是课题组方向
1 回复 分享
发布于 2024-04-28 08:48 黑龙江
请问应该投什么岗位呢这个方向
1 回复 分享
发布于 2024-04-13 20:00 浙江
面得这么恐怖吗
点赞 回复 分享
发布于 2024-09-22 20:53 浙江
mark
点赞 回复 分享
发布于 2024-06-20 00:20 湖北
大佬,这个岗位投递名字是啥啊
点赞 回复 分享
发布于 2024-06-02 15:36 湖北
mark
点赞 回复 分享
发布于 2024-05-07 21:13 湖南
mark
点赞 回复 分享
发布于 2024-05-07 21:13 湖南
mark
点赞 回复 分享
发布于 2024-04-15 21:56 湖北
佬,triton实现pagedattention是手撕吗
点赞 回复 分享
发布于 2024-04-04 14:12 广东

相关推荐

01-01 02:35
门头沟学院 Java
1.实习经历+简历项目a.MCP工具原理,实现,怎么处理调用,模型怎么知道选哪个工具,Client和Server怎么构建b.项目/实习的难点2.操作系统八股:a.Linux 自旋锁和互斥锁b.线程 进程 协程,操作系统里Signal干嘛的,有什么特点c.死锁 产生条件 如何避免d.进程通信方式 优缺点3.有台Linux服务器,负载比较高,连接比较慢,怎么排查怎么处理4.怎么看网卡流量:netstat5.怎么看端口占用:isof6.为什么用RPC,和一般http请求有什么区别?proto序列化过程是什么?7.有一个日志文件(包含ip 状态码 请求时间),写一条bash统计访问最多的三个ip:管道+awk + sort + unia溽8.Python八股:a.装饰器,GILb.浅拷贝 深拷贝,如何深拷贝(deepcopy)什么数据类型默认浅拷贝,什么类型默认深拷贝c.yield怎么用,Python里面垃圾回收怎么做的9.Golang八股:a.协程自动伸缩,Context干啥的b.defer执行顺序c.垃圾回收机制,select机制d.抢占式调度10.计网八股a.tcp紧急指针,tcp流量控制,tcp为什么三次握手,tcp ip四层模型和7层模型分别是什么/对应关系b.http和https区别,dns解析过程c.mtu最大多少字节d.arp缓存表,代理arp应用场景/如何实现e.2层和3层转发f.Nagle和延迟确认是什么?一般怎么实现g.GRE协议 什么作用,怎么实现,报文格式是什么11.算法题 LeetCode 442.数组中重复的数据(原地哈希
查看26道真题和解析
点赞 评论 收藏
分享
评论
7
104
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务