大模型求教
目前刷到好多搞大模型算法的大佬秋招拿到base35k左右的巨奖offer了,不懂就问,大模型算法这条赛道能速成吗?对卡的需求高吗?估计组里最多也就一张3090,还得偷摸着用
#牛客创作赏金赛#
#牛客创作赏金赛#
全部评论
1. 可以速成,3090专注 sft(dpo),rag,量化 2. 速成之后去实习,用组里资源跑实验 3. 实习中后期写一篇论文 4. 刷lc,笔记准备秋招
组里一张 3090 还是算了,微调都很难,可以找找 LLM 的实习试试
找实习也得发论文 没论文就不要卷大模型赛道了
我辣鸡二本组里都有4090
不如搜推
可以速成的,不过可能得多堆一些实习和比赛去弥补论文
没论文别走大模型赛道,卡都没有更别说了
实在不行,如果有实力自己买一张4080,4090摸清楚理论原理,然后去堆实习,在实习过程中和企业一起发论文。
做LLM,paper是必备的,门槛其实很高,你想all in的话必须要很有实力,因为LLM目前落地效果不是很好,你如果没有paper或者工程项目的硬实力的话,工作稳定性十分堪忧,有随时被毕业的风险,并且LLM涉及到的面太广了,花活很多,比如问你深一点的有Cache管理,量化,vLLM,deepspeed,SageAttention等等,这些多多少少都是围绕硬件做的优化和加速,很广的,根本速成不了,建议再考虑考虑应用方向,这个方向好做的多,但是还是涉及到一个稳定性问题。
相关推荐
点赞 评论 收藏
分享