课代表看完招行的训练营空宣来给大家分享总结啦!

看完空宣前辈们的分享,感觉性价比确实很高,是提前拿到Offer的好机会,当然如果最后没有Offer也可能有实习机会,也算是给简历添砖加瓦了,真心建议可以冲!

昨天的空宣干货很多,把真题也拿出来现场解读了,说得很细致,确实很难复述,空宣过程中说后面会把那几个真题解答的视频放出来,大家感兴趣可以蹲一下他们视频号。

先梳理一下活动的时间线吧:

4月24日截止报名

4月下旬线上竞赛

5月开始面试

6-7月线下入营(机酒全包,超赞!)

我浅浅总结一下这场观看空宣下来的攻略(主要靠截图其实:

AI赛道:之前今年出题的前辈透露会考察AI领域的基础知识(敲黑板,划重点!!),可能涉及到概率论、数据统计、机器学习、深度学习、大模型领域的相关基础知识等,就是考察我们对这一块基础知识的储备,前辈提到AI赛道是考察技术,所以平时的技术积累、代码能力还是非常重要的,建议我们多看一些技术类书籍,或者大模型领域的论文。

数据赛道:去年开始,数据赛道有一个挺大的更新,就是强调了和AI的结合应用。数据赛道的前辈也建议我们可以应用大模型解题,他也提到招行很多场景上也开始结合大模型做一些应用,提升快速学习的能力,甚至还能帮助自己理清思路,都是很好的加分项。另外就是团队协作还蛮重要的,需要分工明确,在题赛中,既会有类似初赛的数据打榜形式,也会有产品设计的形式,所以说数据和产品同学之间的交流沟通也是非常重要的。

产品赛道:根据前辈的介绍,产品赛道的初赛多了一个产品经理的基础内容,不过就算没有产品经理工作经历也不用担心(个人觉得题目应该不难)。接着线上复赛是三道题目去选一个来完成自己的产品方案,但是这个产品方案是限时的,只有48小时的准备时间,完成整个流程的加进比较紧张,最后需要产出PPT,但前辈提到去年是减负了,只需要10页PPT,更强调内容的浓缩, idea是最重要的。

其他Tips:

1、 第一时间加入官方群:首先是线上的比赛需要一个人负责一个课题7天(也很容易放弃感觉😩),前辈的经验是前面两天的时候有一个比较明确的思路在解题,到后面就慢慢钻牛角尖了。不过好在招行会创建一个官方讨论群!有很多大佬会在群里开源自己的解法,群内的讨论氛围友好且热烈,前辈也建议我们一定要在比赛前的第一时间加入官方讨论群;

2、 跟业务相结合,会让整个项目更有亮点:前辈大佬也提到除了一般比较常规的特征工程方法外,可以在训练营比赛中,多结合业务的实际去思考,怎么造出有业务逻辑的特征来,一般这种特征在比赛中会非常有用;

3、 注重用户调研,是加分项:产品赛道的前辈提到要注重真实用户的调研,他提到自己当时拿到题目之后,就号召了整个课题组一起来测试,一个个问 MBTI以及使用App的时候会有什么习惯,所以这次调研之后,他还产出了题目限定框架之外的一些想法,给自己的PPT增色不少,在评委心眼里这是加分项,我Mark住了。

#招行数字金融训练营#
全部评论

相关推荐

今天老师给大家分享大模型项目准备经验,供各位同学参考学习。1️⃣大模型流程✅数据处理:1.参考 deepseek 、 llama 、 qwen 等技术报告的数据清洗工作;2.强烈建议使用 Data - Juicer 做启发式数据清洗工具;3.做数据多样性探索,保证 Prompt 的多样性;4.做数据质量增强,用强基座做数据改写等。做拒绝采样保证 response 的" Online "性质。✅开始训练:1.卡多做 CPT ,没卡就基于 Base 模型做 Post - Training ;2.不同规则的模型调参差异大,参考大厂技术报告和其他博客;3.试试不同的训练策略,有挺多 fancy 的增量预训练和 Post - Training 方法,多试试;✅评估 Case :1.在常见的 Benchmark 上看看效果,脚本都有现成的;2.不要只看指标和 loss ,多分析 case ,知道加什么数据,摸清模型的边界能力,持续迭代优化模型能力;3.基座或者 Chat 作为 Baseline ,对比看看效果。2️⃣做一个垂域大模型项目资源准备:你需要准备至少4张3090级别的显卡,核数足够多的 CPU 。✅前期准备:1.调研业务,设计业务场景,分析可行性(数据,技术,实用性);2.会爬虫;3.需要留钱买 API ;✅数据处理:1.爬的数据很脏,一定要做数据清洗;2.如果垂域没那么垂直,比如法律方向,大概率 Base 模型见过了,可以选择不做垂域和通用的数据配比;评估 Case :搞两个 Benchmark ,垂域和通用的,通用不能掉点太多;评估下一致性,从训练集里按任务分层抽样看看 case ;3️⃣做一个大模型应用做完上面两个项目后,其实都可以在此基础上构建一个大模型应用,目前最多的就是 rag 或者 agent 嘛,讲讲如何构建一个 RAG 。✅前置能力:1.学下 Langchain 和 Llama - index ;2.看看简单的 workflow 怎么做的,强烈推荐看看 Anthropic 的《 Building effective agents 》;3.有一定的工程能力。✅参考框架:1.Langchian- Chatchat ,之前笔记就推荐了, rag 很有影响力的开源项目,而且可优化点多;2.Qanything;3.自己手搓个 workflow .可优化点:内容供给;重排策略;微调 embedding ;意图分流单独训个 agent ;优化归纳📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系
点赞 评论 收藏
分享
评论
6
4
分享

创作者周榜

更多
牛客网
牛客企业服务