金九银十过去一半了

大家好,我是青稞,一位2024届的计算机应届毕业生,目前入职快手大模型部门已经快3个月了。

在这个充斥着竞争与焦虑的“金九银十”,我想分享一些关于新人入职的经验与心得,希望能够帮助大家了解快手大模型校招生的体验。

1️⃣ 校招选择

2024届校招可以算是大模型的校招元年,越来越多的互联网大厂、创业公司都开始投入这项技术的研发,在校招上更是呈现了多足鼎立的局面。

考虑到大模型为算法行业带来的蓬勃发展,我决定通过暑期实习的经历将我的就业方向从原先设想的计算机视觉算法调整到大模型算法赛道,并充分结合自己在CV领域的经验选择了多模态大模型内容理解算法的具体岗位。

目前,大模型的算法岗位大体可以根据内容分为生成大模型和理解大模型两类。生成大模型主要专注于生成领域,如通过文本或图片来生成图片、生成视频等;理解大模型则主要聚焦于对已有内容的分析和理解,包括对文本、图片、视频和音频的内容理解。生成大模型在创意、生成性任务中扮演着重要角色,适用于内容生产、智能创作等场景,为大家带来全新的体验;而理解大模型则更强调信息提取、决策支持等应用,广泛用于智能问答、语义理解、搜索推荐等领域。

在24届校招中,我收获了包括百度、微信、淘天、字节、快手、美团、网易、米哈游以及一些初创公司在大模型领域的校招offer。当时我对行业内各家大模型争鸣的情况感到迷茫与纠结,不知道应该怎么选才是最适合自己的选择。本着百闻不如一见,百思不如一试的精神,我决定利用秋招后的时间参与到具体岗位的实习中,对团队和自己都是更好的磨合。

决定了留在北京发展后,我将offer的选择范围锁定在快手、微信和字节中。因为之前就对快手公司浓厚的技术氛围早有耳闻,在校园宣讲会的时候更是能看到许多清华的学长学姐在快手的算法岗位上发光发热,都产出了具有代表性的作品,所以我对这里产生了期待与想要提前实习的想法。在和HR、Leader进行沟通后,Leader帆哥热情地接受了我的实习请求,并且提前通过微信仔细解答我对这个岗位的疑问和顾虑,让我对于这段实习有了充分的认识和规划。因此在结束毕业论文的中期答辩后的第二天,我就以校招实习生的身份入职快手MMU团队。

2️⃣ 实习体验

今年1月中旬,我来到了大模型与多媒体技术部的多模态理解与应用组,参与多模态大模型(MLLM)基座模型的工作。Leader帆哥和校招导师彬哥在与我进行充分的沟通交流后,让我依据自己的兴趣程度进行选择和考量,“不设边界”地思考与探索,我选择跟着彬哥一起做多模态大模型的Supervised Fine-Tuning部分。

1)开放共享的团队文化:快手大模型团队注重分享与合作,每周的技术讨论会和定期的分享会为团队成员提供了一个展示和学习的平台。无论是实习同学还是资深大佬,大家都可以毫无保留地分享自己的想法与心得。尤其在大模型领域,很多算法、架构和模型的细节都需要团队协作才能取得进展,快手的这种开放氛围让知识流动更加顺畅,问题得以更快地解决。也正是在这样的沟通与交流中,我们逐步解决了一个又一个多模态大模型中的技术难关,收获了置信且有价值的认知;

2)敏捷的开发流程:在快手,大模型项目的开发流程非常高效。通过敏捷开发与迭代的方式,团队可以根据项目需求进行快速迭代,不断优化模型效果和性能。每个迭代周期结束后,团队会进行复盘总结,提出改进建议。这种快速试错、不断迭代的方式,不仅让项目进展顺利,也提升了团队的学习速度;

3)技术支持与计算资源保障:快手拥有丰富的技术资源和基础设施支持,特别是在大规模数据处理、分布式计算和高性能计算等方面,快手的技术栈和硬件设施为大模型的研发提供了强大的支持,同时也为大模型团队配备了充足的计算资源这也意味着,作为算法新人,在这里你可以专注于研究问题本身,而不必为GPU资源不足或平台性能担忧;

3️⃣ 入职感受

随着7月份正式入职快手,我对工作内容和工作环境中的挑战与创新有了新的认识,感受到了压力与动力并存的新生活:

1)不断推进模型基座能力:大模型基座能力作为根基是我们在工作中需要迭代的重中之重,只有稳定强大的基座能力,才能支持大模型在足够多场景中的应用与部署。我们团队始终保持技术信仰,不断接受学习来自行业领头公司的技术与方法,定期邀请行业中的技术大佬进行交流分享。在模型迭代的过程中,我和团队解决了包括CoT、Dense Caption、VQA、DPO、PPO等大模型方法和垂直领域的训练与应用,并和我们的应用场景深度结合,进行定制化的方法构造与数据训练。与此同时,我们还研究开发出自己的视觉理解多模态大模型结构,并收获了AK大佬的关注与转发。通过第三方的独立评测,我们自研的20B基座模型在Dense Caption、VQA等多项基础能力上显著超过GPT4。

2)坚持落地解决实际业务:和一些初创公司追求在榜单上的表现不同,快手作为领先的短视频平台,更看重大模型技术给原有的生态和业务能够带来什么样的改观与变化。目前,我们团队训练的多模态大模型已经被应用于电商审核、劣质视频特征识别、推荐系统等多个垂类领域,这需要我们结合不同应用场景的情况,从实际出发考量大模型应该以什么样的形式参与到落地业务中,而不是一味地堆叠参数与数据。这一层面的思考让我感受到在这些应用中,大模型的角色不是万能的解决方案,而是需要精心设计和调整,以解决特定问题。

通过参与这些实际业务的落地,我深刻认识到大模型的应用不应脱离现实,而是要始终围绕用户需求和平台目标展开。这样的技术应用不仅能够提升业务效率,也能为用户带来更好的体验。这种从业务场景出发、不断优化迭代的思路,将是我们团队未来继续推进多模态大模型技术的关键方向。

3)深厚的业务场景积累:快手在短视频、直播等业务场景中积累了丰富的用户数据和多样化的使用场景,为大模型的训练和应用提供了得天独厚的条件。这些数据不仅涵盖了用户的观看偏好、互动行为等基础信息,还包括复杂的情感表达、社交互动等深层次信息,使得大模型可以基于真实场景进行多维度的训练和优化。

相比一些仅专注于理论研究的公司,快手的大模型技术在实际业务中的应用速度更快、效果更佳。通过将大模型技术与业务场景深度结合,快手能够根据实时用户反馈进行不断调整和迭代,从而提升技术的精度与用户体验。

此外,快手庞大的用户基数和活跃的社区生态,也为大模型提供了持续的数据来源和验证平台,进一步加速了技术的成熟与应用落地。这使得快手在人工智能技术的实际应用上具备了显著优势。

4)积极推进科研论文工作:快手在大模型技术的应用上不仅重视实际业务的落地,同时也积极参与学术研究和论文发表。通过与国内外顶尖高校的校企合作,快手的技术团队深入探讨了多模态学习、生成式模型等前沿领域的课题。除此之外,我们还经常邀请行业内的知名学者、论文作者给团队的同学进行线上或线下的工作分享,彼此充分交流学术上的经验与认知。

这种科研与实践相结合的策略,不仅有助于推动大模型技术的理论发展,也让快手在业界和学术界建立了更强的影响力。我们有相当的研究成果被国际顶级会议或期刊采纳,进一步验证了快手技术团队的实力和行业地位。

两个多月来,我的工作体验是充满挑战和成就感的。公司为我们提供了丰富的资源、开放的技术氛围以及广泛的业务场景支持,使得我们能够专注于解决实际问题,推动基座技术、业务落地和科研发展的不断进步。如果你对大模型技术感兴趣,且希望在一个充满机遇的公司里锻炼自己的能力,快手绝对是一个值得考虑的平台。

希望以上分享能够帮助牛客网的同学们更好地了解快手的大模型团队。如果你对大模型、技术研发或快手的工作环境有疑问,欢迎在评论区留言,我会尽力为大家解答。欢迎每一位对大模型感兴趣的同学能够加入我们的团队,一起突破人类认知边界,真正站在人的角度理解内容,做一些有趣的事情!

欢迎大家投递我们部门的校招岗位,2025届校招仍在火热进行中🔥:

内推码:cgUYofpeN

专属内推链接:https://campus.kuaishou.cn/#/campus/jobs?code=cgUYofpeN

#快手校招#
全部评论
清华佬
5 回复 分享
发布于 09-25 15:44 广东
这世上多我一个佬会怎么样
4 回复 分享
发布于 09-26 10:22 江苏
佬!
1 回复 分享
发布于 09-26 10:14 广东
快给他投简历 去跟佬做战友
1 回复 分享
发布于 09-27 03:00 广东
投了!
点赞 回复 分享
发布于 09-25 15:51 上海
咱这边有没有推理优化的方向啊
点赞 回复 分享
发布于 09-25 17:13 陕西
✌️
点赞 回复 分享
发布于 09-26 21:04 浙江
马上10月了
点赞 回复 分享
发布于 09-27 13:33 广东
不愧是清华😭一篇感想比我的毕设还长还细致😭😭😭
点赞 回复 分享
发布于 09-29 14:53 广东
金九银十跟双非没有半毛钱关系
点赞 回复 分享
发布于 09-30 16:14 山东
没接触过大模型,但是学了点部署😢
点赞 回复 分享
发布于 09-30 17:32 四川

相关推荐

本人末二本,C++后端选手,目前手里两个意向:美团移动端和字节客户端。但全网都是劝退客户端的,不知道要不要接。但现在转java已经没办法赶上秋招了,很焦虑,不知道要不要转java备战春招,求各位大佬给给建议。
小破站_程序员YT:作为一个末二本,c++后端选手,手握两个大厂意向,你竟然还在犹豫要不要接,还要去转java? 真不知道你怎么想的。不知道有多少人羡慕你还来不及。
点赞 评论 收藏
分享
108 95 评论
分享
牛客网
牛客企业服务