机器学习/深度学习框架开发秋招记录(持续更新~)

本科信息管理与信息系统专业,研究生跨专业保研至计算机科学与技术专业,本硕均是末流985。研究生期间主要基于MXNet框架搞分布式深度学习,只有一篇在投论文。目前在某互联网公司实习,针对TensorFlow进行二次开发和性能优化。

华为

华为三面都完了,泡池子ing~

7.25 一面

MXNet和TensorFlow有什么区别?
同步训练和异步训练
梯度压缩相关
算法题:螺旋矩阵

7.28 二面

深挖项目,主要是问了项目中遇到啥问题,怎么排查解决的
梯度压缩如何在Allreduce上实现?
Ring Allreduce
问熟悉模型吗,答不熟悉,只知道ResNet和VGG等
算法题:实现循环队列

7.30 三面

业务主管面,时间有点久了,忘记具体问题了,大概就是聊聊家常,没做算法题。

字节提前批——data数据平台开发

春招实习的时候投过一次简历,然后被data部捞起。面完发现方向不符合,挂了。

7.26 一面

Python中的GIL
TCP/IP协议如何保证无差错传输
看过源码,从源码中学到了什么
算法题:合并两个有序数组,如果输入的有序数组是字符串怎么处理

字节提前批复捞——AI Lab

字节提前批结束后,8月3日被AI Lab捞起来了,二面挂。

8.9 一面

对哪种排序比较熟悉?实现一下。(写了个归并排序,然后围绕归并排序问了一堆,大致就是如何优化性能的问题)

8.12 二面

说一下TensorFlow/MXNet从构造计算图到执行的整个函数调用栈。换句话说TF/MXNet如何跑起来的。(这个问题面试时太紧张,没有回答好,只说了自己比较熟悉两个框架的通信流程。其实对着代码也是可以将清楚两个框架的函数调用流程的。。。)
用C++写一个单例模式(之前没看过,花的时间有点久)
算法题:拓扑排序

字节正式批-AML

9.15 一面

简历项目介绍
vector扩容机制
LRU复杂度
读写锁问题
算法题:有向图判环

吐槽一下,面试过程中全称有电流声,听不清面试官讲话,心态爆炸,发挥的也不好,直接GG。

快手提前批

8.9投的快手,正在面试过程中。

8.14 一面

前20min围绕简历进行讨论
用过什么其他的机器学习算法
算法题:求x的平方根
进阶问题:用梯度下降求x的平方根

图森未来

8.17 一面

C++相关:
智能指针实现思路
vector扩容机制,均摊时间复杂度分析
map、unordered_map的区别以及各自的使用场景
移动构造函数、移动语义

linux相关:
如何杀死进程?kill一共有多少种信号?
统计目录下的文件
ps/top命令使用

算法题:
(1)实现一个有理数类,支持加法和乘法
(2)一个大矩阵,0表示海,1和2表示陆地。现在矩阵里有两块由1组成的岛屿,一块由2组成的岛屿,求一条最短路径链接这两个1岛屿,要求路径不能经过2岛屿

8.28 二面

简历项目交流
MXNet同步、异步更新策略
PS/Ring Allreduce架构下,模型分布式训练的通信量
large batch size训练,如何保证模型收敛;warmup的作用是什么

9.7 三面

面试官貌似是图森算法组leader,主要聊了一下在图森的工作内容,7分钟结束战斗

百度

8.29 一面

vector和list区别,跳表
map实现,红黑树原理
lmabda表达式、移动语义
IEEE754格式
进程/线程, 死锁
Allreduce实现(Ring、Tree),什么情况下用ring,什么情况下用tree
梯度压缩的原理与效果
如何对深度学习模型的分布式训练过程进行优化
RDMA/GPU Direct RDMA
Horovod相关原理
算法题:实现内存拷贝函数

9.6 二面

简单介绍下PS-Lite源码
MXNet训练流程的函数调用过程
梯度压缩原理与性能

9.6 三面

主管面,主要聊了下实习期间做的一些事情

BIGO

9.1 一面

前15min探讨了一下梯度压缩
TCP如何保证无差错传输
进程与线程的区别
浏览器输入网址到页面展示的整个过程
哈希表
c++多态实现方式、虚函数和虚表
给出一段模板代码,判断能否正确运行
算法题:leetcode 86 分割链表

旷视

9.22 一面

梯度压缩相关问题
算法题:拓扑排序

9.22 二面

多进程与多线程区别
emplace_back和push_back区别
算法题:LeetCode168 Excel表列名称

商汤

9.28 一面

梯度压缩相关问题
new/malloc区别,new/delete不配对问题
右值引用,移动语义
算法题:
(1)求解全排列,LeetCode46
(2)实现线程安全的单例模式

依图

9.28 一面

梯度压缩相关
Ring Allreduce/Tree Allreduce/蝶式Allreudce
了解过RDMA没有
对OpenMP了解多少
算法题:
(1)给出一个字符串"Ab34d D9E",对翻转每个单词中的字母,返回"db34A E9D"
(2)使用send/recv/isend/irecv/wait等通信原语实现高效的Allreduce算法

简历筛选/笔试中

小米、360、京东、阿里、腾讯

挂掉的

网易互联网:笔试挂(AC 2/4)
网易互娱:简历挂
哔哩哔哩:笔试AK,未通过

#百度##华为##字节跳动##图森未来##快手##BIGO#
全部评论
请问一下楼主的bg是什么?
点赞 回复 分享
发布于 2023-12-25 10:35 安徽
楼主最后去哪了?
点赞 回复 分享
发布于 2021-03-26 05:05
请问图森的代码是手撕还是讲讲思路啊
点赞 回复 分享
发布于 2020-08-29 16:10

相关推荐

组内直招,我给自己捞一下实习生联系方式****************************职位描述1、负责机器学习训练和推理系统的研发与性能优化,包括但不限于:超大模型计算性能优化、千卡训练集群调优、分布式推理系统、大规模推理流量调度等;2、负责解决大规模AI系统中高并发、高可靠性、高可扩展性等技术难关,支撑公司内外千万客户流量需求;3、负责大模型训练和推理前瞻性技术架构的调研和引入,技术方案不限于分布式训推系统、子图匹配、编译优化、模型量化等;4、负责异构硬件的引入与训练推理框架的集成,包括但不限于GPU、NPU、TPU等;5、面向全球多地域超大规模GPU算力集群,通过弹性调度、GPU 超卖、任务编排等方式不断提升算力利用率;6、与算法部门深度合作,分析性能瓶颈,通过软硬结合提升模型训推效率,支持AI工具链和技术生态建设,推动公司AI关键业务发展。职位要求1、2026届本科及以上学历在读,计算机、软件工程等相关专业优先;2、熟悉常见的算法、设计模式和数据结构,具备扎实的操作系统、计算机体系结构等知识;3、独立分析问题和解决问题,自我驱动并对过程负责;4、以下条件为加分项:1)能够理解GPU硬件架构,熟悉GPU软件栈(CUDA,cuDNN),具备GPU性能分析的经验;2)参与机器学习系统开源社区项目经验,熟悉机器学习系统各项流程中的工作原理;3)有至少一种大模型训练/推理框架使用经验,包括但不限于:vLLM、TensorRT-LLM、SGLang、Megatron-LM等。
投递字节跳动等公司9个岗位
点赞 评论 收藏
分享
03-11 17:03
已编辑
门头沟学院 Java
一面 45min1. 自我介绍2. 介绍项目的具体使用3. 了解过市面上类似的项目吗?4. redis+lua脚本实现限流,具体如何实现的?5. 为什么要用lua脚本(答:原子性)6. 使用pipeline能实现类似的效果吗?7. lua脚本里面的每条指令都一定执行成功或者一定执行失败吗?比如说:脚本里面三条指令,第二条执行失败会怎么样?8. 为什么要把消息放到rocketmq?(答:消息的异步解耦)9. 如果没有rocketmq,有类似的方法实现吗?比如说redis或者mysql实现10. 除了java语言,你还用过什么语言11. java经常使用的一些数据类型有哪些12. 数据的集合或者容器有哪些?13. 你刚才提到set和map都是有hash结构,还有哪些可以通过非hash方式实现map结构(引导我往树方面思考,没答上来,好像treeMap)14. 链表的特点15. 如果频繁的进行链表增删,有什么需要考虑的问题?(引导:如果每次增加需要创建一块内存区域,如果删除呢?)16. 如果我想要从链表某一个特定位置开始访问,有什么优化方案吗?比如说一堆电话号码,我想要从138的开始访问,跳过从130开始的一系列号码17. TCP和UDP的区别18. 什么情况下使用TCP,什么情况下使用UDP19. 视频聊天的场景下,只使用UDP就可以了吗?在丢包的情况下,如何保证通话画面是连续的?20. 或者说其他任何一个使用UDP的场景,比如游戏,并不是数据丢失了就算了,遇到这种情况如何处理?21. TCP如何应对这种场景呢?22. TCP的数据一定不会丢失吗?23. 手撕代码:一个表,表里每行数据包括3个字段 id,color,shape,有两种操作:C和S,分别代表操作color和shape,分别设置color或shape为‘Y’。数据输入:输入总行数n,要查询的行号i,要操作的次数k,接下来k行输入要修改的类型 C或S,要修改的行数范围a, b,最后输出第i行的结果
查看23道真题和解析
点赞 评论 收藏
分享
评论
9
80
分享

创作者周榜

更多
牛客网
牛客企业服务