字节AML高性能计算提前批一面经

1,25分钟简历+项目周边八股,开始面了之后才知道现在都all in 大模型了,看到我简历上有大模型相关的就狂问大模型训练、微调、分布式等等细节,之前准备的高性能八股一点没问。。。
2,算法题是手撕attention算子,只用写前向不用写反向,基于numpy实现,还需要自己手写softmax,这个我之前看过llama的推理源码,能回忆起来一些,大致写出来了,但是v的shape有一些问题,最终跑通了但是shape不太对,面试官扫了一遍让我讲讲,讲完就完事了。

目前等结果,希望能过,对于我这种菜鸡来说提前批能多面一次就是胜利。

更新:三面完了,被主管吊打,感觉要g
全部评论
大哥。高性能八股是啥?哪里能看,能推一下吗?
6 回复 分享
发布于 2023-07-20 20:59 湖北
同求高性能八股
3 回复 分享
发布于 2023-07-21 19:11 澳大利亚
大佬您好,请问二面了吗
2 回复 分享
发布于 2023-08-02 14:55 辽宁
大佬稳的
1 回复 分享
发布于 2023-07-21 08:19 北京
啊这 这面试官也是追风口吗
1 回复 分享
发布于 2023-07-21 17:04 江苏
算法岗?
点赞 回复 分享
发布于 2023-07-21 16:52 浙江
求高性能八股
点赞 回复 分享
发布于 2023-07-24 15:29 广东
请问算法岗还是研发呀
点赞 回复 分享
发布于 2023-07-25 15:55 北京
求高性能八股!
点赞 回复 分享
发布于 2023-07-30 16:40 上海
大佬后续二面了吗
点赞 回复 分享
发布于 2023-08-09 11:18 北京
求高性能八股
点赞 回复 分享
发布于 2023-09-15 21:18 北京
是aml推理部门吗
点赞 回复 分享
发布于 2023-10-25 22:53 广东
求高性能八股
点赞 回复 分享
发布于 2023-12-26 15:32 广东
求高性能八股
点赞 回复 分享
发布于 2024-01-08 14:34 北京
同求高性能八股,谢谢佬!
点赞 回复 分享
发布于 2024-01-11 22:23 北京
大哥。高性能八股是啥?哪里能看,能推一下吗?
点赞 回复 分享
发布于 2024-02-20 14:18 北京
求高性能八股
点赞 回复 分享
发布于 2024-02-25 23:49 上海
求高性能八股
点赞 回复 分享
发布于 2024-02-26 17:54 江苏
求高性能八股
点赞 回复 分享
发布于 2024-03-06 18:13 香港
大佬,求高性能八股
点赞 回复 分享
发布于 2024-05-15 21:24 波兰

相关推荐

组内直招,我给自己捞一下实习生联系方式****************************职位描述1、负责机器学习训练和推理系统的研发与性能优化,包括但不限于:超大模型计算性能优化、千卡训练集群调优、分布式推理系统、大规模推理流量调度等;2、负责解决大规模AI系统中高并发、高可靠性、高可扩展性等技术难关,支撑公司内外千万客户流量需求;3、负责大模型训练和推理前瞻性技术架构的调研和引入,技术方案不限于分布式训推系统、子图匹配、编译优化、模型量化等;4、负责异构硬件的引入与训练推理框架的集成,包括但不限于GPU、NPU、TPU等;5、面向全球多地域超大规模GPU算力集群,通过弹性调度、GPU 超卖、任务编排等方式不断提升算力利用率;6、与算法部门深度合作,分析性能瓶颈,通过软硬结合提升模型训推效率,支持AI工具链和技术生态建设,推动公司AI关键业务发展。职位要求1、2026届本科及以上学历在读,计算机、软件工程等相关专业优先;2、熟悉常见的算法、设计模式和数据结构,具备扎实的操作系统、计算机体系结构等知识;3、独立分析问题和解决问题,自我驱动并对过程负责;4、以下条件为加分项:1)能够理解GPU硬件架构,熟悉GPU软件栈(CUDA,cuDNN),具备GPU性能分析的经验;2)参与机器学习系统开源社区项目经验,熟悉机器学习系统各项流程中的工作原理;3)有至少一种大模型训练/推理框架使用经验,包括但不限于:vLLM、TensorRT-LLM、SGLang、Megatron-LM等。
投递字节跳动等公司6个岗位
点赞 评论 收藏
分享
03-11 17:03
已编辑
门头沟学院 Java
一面 45min1. 自我介绍2. 介绍项目的具体使用3. 了解过市面上类似的项目吗?4. redis+lua脚本实现限流,具体如何实现的?5. 为什么要用lua脚本(答:原子性)6. 使用pipeline能实现类似的效果吗?7. lua脚本里面的每条指令都一定执行成功或者一定执行失败吗?比如说:脚本里面三条指令,第二条执行失败会怎么样?8. 为什么要把消息放到rocketmq?(答:消息的异步解耦)9. 如果没有rocketmq,有类似的方法实现吗?比如说redis或者mysql实现10. 除了java语言,你还用过什么语言11. java经常使用的一些数据类型有哪些12. 数据的集合或者容器有哪些?13. 你刚才提到set和map都是有hash结构,还有哪些可以通过非hash方式实现map结构(引导我往树方面思考,没答上来,好像treeMap)14. 链表的特点15. 如果频繁的进行链表增删,有什么需要考虑的问题?(引导:如果每次增加需要创建一块内存区域,如果删除呢?)16. 如果我想要从链表某一个特定位置开始访问,有什么优化方案吗?比如说一堆电话号码,我想要从138的开始访问,跳过从130开始的一系列号码17. TCP和UDP的区别18. 什么情况下使用TCP,什么情况下使用UDP19. 视频聊天的场景下,只使用UDP就可以了吗?在丢包的情况下,如何保证通话画面是连续的?20. 或者说其他任何一个使用UDP的场景,比如游戏,并不是数据丢失了就算了,遇到这种情况如何处理?21. TCP如何应对这种场景呢?22. TCP的数据一定不会丢失吗?23. 手撕代码:一个表,表里每行数据包括3个字段 id,color,shape,有两种操作:C和S,分别代表操作color和shape,分别设置color或shape为‘Y’。数据输入:输入总行数n,要查询的行号i,要操作的次数k,接下来k行输入要修改的类型 C或S,要修改的行数范围a, b,最后输出第i行的结果
查看23道真题和解析
点赞 评论 收藏
分享
评论
15
102
分享

创作者周榜

更多
牛客网
牛客企业服务