大模型是实习重要还是论文重要?
自从转llm后一直看到类似的问题,下面想简单谈一下我自己的理解(叠甲)。
1. 谁更重要?
先说结论,match论文 > match实习 >> 不match实习 > 不match论论文。match指大模型相关,但是topic不同。topic指具体的研究方向,如CPT,PT,RAG,推理优化下面的 **具体task** 。
- match论文指大模型相关的,topic是面试部门关注的 论文。但实际上这样的论文非常少,这不光与研究水平有关,更与研究兴趣相关。企业关心的问题往往是具体且trivial的,而学界关心的问题是前瞻且high level的。尽管我们能够用一些fancy 方法在公开数据上做一个SOTA的论文,但是有多少工业界可以用的上呢?当然,不排除有高手,可以把trivial的问题抽象成科学问题并很好地解决它。但具备这样研究能力的人也是非常稀少的。那少具体是多少呢?以今年为例,如果match论文1a1b硕士大概率是可以人才计划的。
- match实习是指在部门专注的方向上做了工程实践,踩了很多坑有很多经验,但是没有用一个fancy方法解决它并整理成一篇论文。相比于最后的产出物,经过实践训练得到的经验和认知对企业来说是更务实的选择。并且,只要后续持续进行科研训练,具备实践经验的人也有更大的机会在部门专注的这个方向上发表论文。
- 不match实习是指,大模型实习,实习期间做的东西和部门有gap,但是依旧有很多工程实践,能在企业级setting下工作。match实习显然比不match实习更好。
- 不match论文是指,大模型论文,和部门有gap,但是在实验室级setting下工作。一般来说,实验室环境要比企业环境的工程要求低很多。企业环境在实验规模,数据质量,针对生产环境的结果分析与实验设计上需要专门的训练。
简单来说,干相关的活且干的好的人>能干相关的活的人>能干活的人>基础好的人。如果你是部门ld,你想招人提升业绩,你会选谁呢?
2. 应该怎么做?
根据上面的说法,惯性的做法应该是根据自己的实际情况选择发match论文或者match实习。但是这样做就是最好的吗?我觉得不是。虽然谁重要这个问题看起来问的是精力分配,但是评论下的答案往往是具体的选择。这是一种典型的学生思维,先入为主地认为实习和论文本身就是互斥的。但事实上两者并不冲突,实习论文两者都有只会让你有更大概率获得心仪的offer。所以最优解应该是去公司实习,实习时以发表论文为目标规划后面的实习安排(也可以一步到位是研究实习)。前期深入项目,熟悉业务,现有方法和实验流程。然后针对部门当前普遍关心的技术问题,抽象或类比到现有的科学问题。用公司的卡,公司的数据(或开源数据)完成这篇工作。最后在实习过程中把这个技术上线用起来。我知道,上面说的每一步都不容易。但是做了没做出来 和 根本没想做 对个人能力提升的差距会非常大。我们可以以论文为目标安排工作,比如怎么设计实验,怎么分析结果,怎么改进方案。即便方案最后无法达到预期,我们也可以退而求其次,发b,发c或者专利。上线效果可以没那么好,但是要用起来,并分析为什么work为什么不work,最后给出定量结果与定性结论。当你能完整地走完这样一个算法开发,迭代,发版的流程后,你势必已经对这个topic积累了很多深刻见解。至于论文,很多时候真的需要一点运气。
1. 谁更重要?
先说结论,match论文 > match实习 >> 不match实习 > 不match论论文。match指大模型相关,但是topic不同。topic指具体的研究方向,如CPT,PT,RAG,推理优化下面的 **具体task** 。
- match论文指大模型相关的,topic是面试部门关注的 论文。但实际上这样的论文非常少,这不光与研究水平有关,更与研究兴趣相关。企业关心的问题往往是具体且trivial的,而学界关心的问题是前瞻且high level的。尽管我们能够用一些fancy 方法在公开数据上做一个SOTA的论文,但是有多少工业界可以用的上呢?当然,不排除有高手,可以把trivial的问题抽象成科学问题并很好地解决它。但具备这样研究能力的人也是非常稀少的。那少具体是多少呢?以今年为例,如果match论文1a1b硕士大概率是可以人才计划的。
- match实习是指在部门专注的方向上做了工程实践,踩了很多坑有很多经验,但是没有用一个fancy方法解决它并整理成一篇论文。相比于最后的产出物,经过实践训练得到的经验和认知对企业来说是更务实的选择。并且,只要后续持续进行科研训练,具备实践经验的人也有更大的机会在部门专注的这个方向上发表论文。
- 不match实习是指,大模型实习,实习期间做的东西和部门有gap,但是依旧有很多工程实践,能在企业级setting下工作。match实习显然比不match实习更好。
- 不match论文是指,大模型论文,和部门有gap,但是在实验室级setting下工作。一般来说,实验室环境要比企业环境的工程要求低很多。企业环境在实验规模,数据质量,针对生产环境的结果分析与实验设计上需要专门的训练。
简单来说,干相关的活且干的好的人>能干相关的活的人>能干活的人>基础好的人。如果你是部门ld,你想招人提升业绩,你会选谁呢?
2. 应该怎么做?
根据上面的说法,惯性的做法应该是根据自己的实际情况选择发match论文或者match实习。但是这样做就是最好的吗?我觉得不是。虽然谁重要这个问题看起来问的是精力分配,但是评论下的答案往往是具体的选择。这是一种典型的学生思维,先入为主地认为实习和论文本身就是互斥的。但事实上两者并不冲突,实习论文两者都有只会让你有更大概率获得心仪的offer。所以最优解应该是去公司实习,实习时以发表论文为目标规划后面的实习安排(也可以一步到位是研究实习)。前期深入项目,熟悉业务,现有方法和实验流程。然后针对部门当前普遍关心的技术问题,抽象或类比到现有的科学问题。用公司的卡,公司的数据(或开源数据)完成这篇工作。最后在实习过程中把这个技术上线用起来。我知道,上面说的每一步都不容易。但是做了没做出来 和 根本没想做 对个人能力提升的差距会非常大。我们可以以论文为目标安排工作,比如怎么设计实验,怎么分析结果,怎么改进方案。即便方案最后无法达到预期,我们也可以退而求其次,发b,发c或者专利。上线效果可以没那么好,但是要用起来,并分析为什么work为什么不work,最后给出定量结果与定性结论。当你能完整地走完这样一个算法开发,迭代,发版的流程后,你势必已经对这个topic积累了很多深刻见解。至于论文,很多时候真的需要一点运气。
全部评论
好文~
相关推荐
W大将军:啥时候发邮件说了么
投递快手等公司10个岗位 >
点赞 评论 收藏
分享