字节高性能计算一面挂

首先问了项目。
问了Cuda编程一般怎么优化
问了卷积如何优化
懂不懂共享内存
你一般怎么对Cuda编程进行优化
然后是c++八股
C的Malloc和c++的new有什么区别
Cpp的四种强制类型转换
深拷贝和浅拷贝
智能指针
如何防止内存泄漏
智能指针的实现原理
Vim的操作知识
会不会用gdb
平常用别的编程环境吗
有没有Ai部署的经验
算法题 图的最短连通路径长度
反问
全部评论
佬,我都约不了面
1 回复 分享
发布于 2023-07-31 19:35 广东
大佬
点赞 回复 分享
发布于 2023-08-02 18:38 浙江
vocal!同一中,同方向,这么巧!
点赞 回复 分享
发布于 2024-10-15 00:25 北京

相关推荐

组内直招,我给自己捞一下实习生联系方式****************************职位描述1、负责机器学习训练和推理系统的研发与性能优化,包括但不限于:超大模型计算性能优化、千卡训练集群调优、分布式推理系统、大规模推理流量调度等;2、负责解决大规模AI系统中高并发、高可靠性、高可扩展性等技术难关,支撑公司内外千万客户流量需求;3、负责大模型训练和推理前瞻性技术架构的调研和引入,技术方案不限于分布式训推系统、子图匹配、编译优化、模型量化等;4、负责异构硬件的引入与训练推理框架的集成,包括但不限于GPU、NPU、TPU等;5、面向全球多地域超大规模GPU算力集群,通过弹性调度、GPU 超卖、任务编排等方式不断提升算力利用率;6、与算法部门深度合作,分析性能瓶颈,通过软硬结合提升模型训推效率,支持AI工具链和技术生态建设,推动公司AI关键业务发展。职位要求1、2026届本科及以上学历在读,计算机、软件工程等相关专业优先;2、熟悉常见的算法、设计模式和数据结构,具备扎实的操作系统、计算机体系结构等知识;3、独立分析问题和解决问题,自我驱动并对过程负责;4、以下条件为加分项:1)能够理解GPU硬件架构,熟悉GPU软件栈(CUDA,cuDNN),具备GPU性能分析的经验;2)参与机器学习系统开源社区项目经验,熟悉机器学习系统各项流程中的工作原理;3)有至少一种大模型训练/推理框架使用经验,包括但不限于:vLLM、TensorRT-LLM、SGLang、Megatron-LM等。
投递抖音信息等公司10个岗位
点赞 评论 收藏
分享
评论
6
107
分享

创作者周榜

更多
牛客网
牛客企业服务