05-21 20:15 北京邮电大学算法工程师

关注

求问，大模型推理加速怎么系统的学习

如题，目前是做大模型的，主要做方法上的创新。但是个人很喜欢底层的一些技术，想系统学习一下推理加速这些mlsys的内容和研究。马上也要读博了，老师比较放养，研究方向可以根据自己的兴趣来。有没有大佬指点一下，这些偏底层的研究方向怎么入门。

全部评论

推荐最新楼层

牛客344243631号

门头沟学院算法工程师

先掌握transformer的架构，然后知道推理的整体的参数情况和开销（包括推理的时候在GPU那部分的计算，通信开销），接着去看各个大模型的架构，比如mqa，gqa，moe，mla的修改，后面看flash attention，稀疏注意力相关的内容，还有什么批推理加速之类的。一个更好的方法是去看项目，让你导师给你几个项目这样会比较有头绪。

9 回复分享

发布于 06-10 18:36 辽宁

是我的神的做题家很亲切

北京航空航天大学人工智能

找个科研实习？

点赞回复分享

发布于 07-25 12:05 北京

11-23 13:42

门头沟学院机器学习

海康威视：高性能计算面经

10.24一面（30分钟） 介绍超算平台项目； 国外平台和国产平台对比； 分布式训练方面的瓶颈； 推理这块的理解； 量化过程中出现掉点的情况如何排查； 期望的工作内容规划； 对一个新领域的学习如何进行； 分享的一个比较困难的阶段、如何解决； 怎么缓解压力； 手撕：合并两个有序数组； 10.29二面（线下HR面）

查看10道真题和解析

点赞评论收藏

分享

11-14 19:00

北京联合大学机器学习

26实习投递记录11.10-11.15

周一投完这周共5个面试 面完3个 时间冲突放弃1个 周五还剩1个力扣和数据结构没怎么刷先上战场了 面试中目前失败一个（写了65%）研一下到现在学了半年CUDA和TensorRT构建推理引擎 各类模型的高性能算子和高性能推理还缺乏实践 更深的TVM，分布式的deepseed和汇编没时间了 现在迷茫了 要学的很多且可能学完依旧找不到 #高性能计算#  #高性能计算面经#  #HPC高性能计算工程师#

点赞评论收藏

分享

11-04 11:18

抖音视界_iOS工程师

[北京/深圳部门直招] 抖音搜索招人啦

加入我们，你将获得：参与抖音搜索核心业务研发，打造亿级用户产品。 与顶尖技术团队合作，学习和成长，快速提升技术能力。 参与 LLM 在端侧的应用和创新，探索前沿技术，引领行业发展。 拥有极具竞争力的薪资福利，享受字节跳动提供的丰富员工福利。工作地点： 北京/深圳岗位类型：社招/校招/实习社招 iOS 深圳：https://job.toutiao.com/s/iSS9a9ne社招 iOS 北京：https://job.toutiao.com/s/iSS9f55H社招 Android 深圳：https://job.toutiao.com/s/iSS9MgFT社招 Android 北京：https:...

投递字节跳动等公司10个岗位 >

点赞评论收藏

分享

11-14 18:46

已编辑

北京服装学院人工智能

大厂还是中厂

投票

大厂还是中厂？读研期间主要做llm infra的一些算法层面的工作，科研和实习都是主要做这个，但是没太好的paper产出。秋招发现ai infra被疯狂劝退，开始有些犹豫。手上有一个大厂ai infra的意向，组在业内比较有名，但产品似乎也没人用。以及一个中厂的llm算法的意向，外企风格的中厂，大家都说技术一般。大厂钱多，中厂会轻松一点。不过比起钱，我还是更想选一个好跳槽比较有发展的好方向，虽然有些犹豫但是不是转到算法会更好呢？#阿里# #腾讯# #字节#

点赞评论收藏

分享

11-09 09:29

中国科学院大学算法工程师

【快手】大模型小型化算法实习生招聘

工作岗位：快手-AI平台-大模型小型化算法实习生工作地点：北京市海淀区西二旗中路29号元中心岗位要求：● 数理要求: 熟练掌握线性代数，概率论，信息论，凸优化等基础知识；了解矩阵论, 随机过程等● 框架要求: 精通PyTorch，熟练大模型并行框架的应用，包括 DeepSpeed，Megatron-LM● 代码要求: 精通Python● 对模型加速的算法研究有浓厚的兴趣，特别是针对LLM和SoRA等前沿模型的推理加速探索● 有论文发表经验优先，提供算力支持对创新idea的研究和应用岗位职责：● 负责快手内部AIGC大模型的推理部署效率优化需求，包括但不限于Diffusion采样时间优化，Dif...

投递快手等公司10个岗位 >

点赞评论收藏

分享

评论

1

6

全站热榜

正在热议

# 拼多多求职进展汇总 #

233337次浏览 2030人参与

# 在职场上，你最讨厌什么样的同事 #

5712次浏览 81人参与

# 阿里云管培生offer #

58974次浏览 1748人参与

# 25届秋招总结 #

396550次浏览 3976人参与

# 哪些公司校招卡第一学历 #

32830次浏览 105人参与

# 地方国企笔面经互助 #

6544次浏览 16人参与

# 北方华创开奖 #

66005次浏览 549人参与

# ai智能作图 #

21381次浏览 262人参与

# 硬件兄弟们甩出你的华为奖状 #

77945次浏览 625人参与

# 实习，投递多份简历没人回复怎么办 #

2435854次浏览 34703人参与

# 工作中，你有没有遇到非常爱骂人的领导？ #

4724次浏览 47人参与

# 实习与准备秋招该如何平衡 #

722800次浏览 8551人参与

# 我的实习求职记录 #

6121490次浏览 83953人参与

# 如果再来一次，你还会选择这个工作吗？ #

110448次浏览 1109人参与

# 25届机械人为了秋招做了哪些准备？ #

24992次浏览 355人参与

# 签了三方后想毁约怎么办 #

18563次浏览 111人参与

# 如果你有一天可以担任公司的CEO，你会做哪三件事？ #

9956次浏览 213人参与

# 机械求职避坑tips #

22156次浏览 240人参与

# 游戏求职进展汇总 #

52766次浏览 344人参与

# 夸夸我的求职搭子 #

132021次浏览 1360人参与

# 腾讯求职进展汇总 #

207571次浏览 1694人参与

# 实习想申请秋招offer，能不能argue薪资 #

35785次浏览 308人参与

牛客网
牛客企业服务