大模型是实习重要还是论文重要?

自从转llm后一直看到类似的问题,下面想简单谈一下我自己的理解(叠甲)。

1. 谁更重要?

先说结论,match论文 > match实习 >> 不match实习 > 不match论论文。match指大模型相关,但是topic不同。topic指具体的研究方向,如CPT,PT,RAG,推理优化下面的 **具体task** 。

- match论文指大模型相关的,topic是面试部门关注的 论文。但实际上这样的论文非常少,这不光与研究水平有关,更与研究兴趣相关。企业关心的问题往往是具体且trivial的,而学界关心的问题是前瞻且high level的。尽管我们能够用一些fancy 方法在公开数据上做一个SOTA的论文,但是有多少工业界可以用的上呢?当然,不排除有高手,可以把trivial的问题抽象成科学问题并很好地解决它。但具备这样研究能力的人也是非常稀少的。那少具体是多少呢?以今年为例,如果match论文1a1b硕士大概率是可以人才计划的。
- match实习是指在部门专注的方向上做了工程实践,踩了很多坑有很多经验,但是没有用一个fancy方法解决它并整理成一篇论文。相比于最后的产出物,经过实践训练得到的经验和认知对企业来说是更务实的选择。并且,只要后续持续进行科研训练,具备实践经验的人也有更大的机会在部门专注的这个方向上发表论文。
- 不match实习是指,大模型实习,实习期间做的东西和部门有gap,但是依旧有很多工程实践,能在企业级setting下工作。match实习显然比不match实习更好。
- 不match论文是指,大模型论文,和部门有gap,但是在实验室级setting下工作。一般来说,实验室环境要比企业环境的工程要求低很多。企业环境在实验规模,数据质量,针对生产环境的结果分析与实验设计上需要专门的训练。

简单来说,干相关的活且干的好的人>能干相关的活的人>能干活的人>基础好的人。如果你是部门ld,你想招人提升业绩,你会选谁呢?

2. 应该怎么做?

根据上面的说法,惯性的做法应该是根据自己的实际情况选择发match论文或者match实习。但是这样做就是最好的吗?我觉得不是。虽然谁重要这个问题看起来问的是精力分配,但是评论下的答案往往是具体的选择。这是一种典型的学生思维,先入为主地认为实习和论文本身就是互斥的。但事实上两者并不冲突,实习论文两者都有只会让你有更大概率获得心仪的offer。所以最优解应该是去公司实习,实习时以发表论文为目标规划后面的实习安排(也可以一步到位是研究实习)。前期深入项目,熟悉业务,现有方法和实验流程。然后针对部门当前普遍关心的技术问题,抽象或类比到现有的科学问题。用公司的卡,公司的数据(或开源数据)完成这篇工作。最后在实习过程中把这个技术上线用起来。我知道,上面说的每一步都不容易。但是做了没做出来 和 根本没想做 对个人能力提升的差距会非常大。我们可以以论文为目标安排工作,比如怎么设计实验,怎么分析结果,怎么改进方案。即便方案最后无法达到预期,我们也可以退而求其次,发b,发c或者专利。上线效果可以没那么好,但是要用起来,并分析为什么work为什么不work,最后给出定量结果与定性结论。当你能完整地走完这样一个算法开发,迭代,发版的流程后,你势必已经对这个topic积累了很多深刻见解。至于论文,很多时候真的需要一点运气。
全部评论
好文~
点赞 回复 分享
发布于 昨天 18:25 江苏

相关推荐

昨天 00:53
门头沟学院 后端
记录一下反面典型吧,研一刚进组的时候踌躇满志,导师也画了各种大饼,但是我们组之前氛围确实蛮好的,我也是看到了比较积极的评价才进组的。但事与愿违,后来研一一整年,整个课题组就两个学生(研究方向比较偏门)没有分配小导指导,大导完全没时间,我一度怀疑导师是不是离开科研岗位太久,提出的方向完全想一出是一出。导致研一基本上没有做什么有意义的工作,换了三个方向后感觉已经完全没有动力做下去了。但是身边的同学都在博士的指导下稳步推进,我联系了导师好几次询问进展也是草草带过。现在又换到一个新的方向,导师也是不闻不问,距离开题还有大概三天。自己找了对应领域的论文简单看了一下,这个领域大部分的论文要么不开源,要么没有数据集。现在感觉非常心累,我自认为不是一个聪明的人,但也算不上多笨,第一次在读研期间感到这种挫败感——最关键一点在于,这种挫败感不是那种不努力摆烂混日子没进展,而是花了很多时间去消化学习,但是仿佛一拳打在棉花上的无力感。作为一个双非的研究生,研究方向还是最卷的cv,浑浑噩噩耗费了一年,现在属于是既没有培养自己的技术栈,也没有养成良好的科研能力。深夜絮絮叨叨写了这么多,希望自己两年后看到能不后悔吧。#牛客创作赏金赛#
点赞 评论 收藏
分享
7 6 评论
分享
牛客网
牛客企业服务