秋招第一面:快手大模型应用

8.19
自我介绍
问最近的一个实习项目,是做口腔大模型的:(侧重于模型训练)
1.数据集规模、筛选和配比
2.超参数有哪些。学习率的选择,怎么寻找超参。小规模数据,怎么跑的,是串行还是并行。loss曲线怎么看的
3.DeepSpeed介绍,用的什么配置(zero_2)
4.为什么选择 Qwen1.5-32B-chat (就俩卡,用57B跑的太慢)
5.BLEU-4的计算公式
5.模型评估是怎么做的?

第二个实习经历,是做的RAG(侧重于模型底层原理)
1.lora介绍,秩的数学意义,怎么计算矩阵的秩
2.多路召回是怎么实现的
3.向量模型和重排模型的微调是怎么做的
4.交叉熵的计算公式。在前向传播的时候为什么选择交叉熵作为loss,为什么不用mse(为什么
5.在模型预测的时候,softmax是把词表的全部token的概率都归一化吗?词表都很大,怎么加速计算(我也没算过啊

本科的项目经历,是一个微博舆情主题及情感演化的时空分析,GitHub上500多star。(侧重于项目设计思路)
1.项目的选题和意义
2.项目的设计框架

算法题:
最大连续子数组和。有印象,但是写得太快了没定义好,出现了很多bug,在面试官不断提醒错了后逐步debug出来了。

没咋考RAG,更多的是模型侧的,有些没有学到那么深。应用我以为是重点考RAG呢,复习重点错了
#快手求职进展汇总##你的秋招第一面感觉怎么样##九月投秋招是不是太晚了?#
全部评论
第一面很厉害了
1 回复 分享
发布于 08-21 23:50 黑龙江
佬投的杭州还是北京呀
1 回复 分享
发布于 08-22 20:26 北京
友塔游戏
校招火热招聘中
官网直投
佬是投正式批吗
点赞 回复 分享
发布于 08-20 17:26 北京
佬,请问RAG评估的话一般怎么回答呀
点赞 回复 分享
发布于 08-24 01:03 北京
m
点赞 回复 分享
发布于 09-01 12:15 浙江
同学,考虑字节商业化LLM算法嘛~
点赞 回复 分享
发布于 09-03 10:47 北京

相关推荐

多模态 & 大模型 & Agent 正式员工(*3) & 实习生招聘 (*5,实习时间>=3个月)1、团队介绍我们是快手垂搜大模型团队,致力于构建视觉大模型、多模态搜索、User Agent新系统,应用于多种电商场景(如拍照搜同款、图文相似款、电商创意AIGC,买家Agent问答)。团队紧随技术潮流,不断技术/商业创新,期待与优秀的同学一道,进一步扩大影响力。团队一直坚持学术与业务并向发展的方式,目前在CVPR、WWW、AAAI、SIGIR等会议发表论文多篇 (其中一篇Shared Task Best Paper, 一篇Outstanding Paper),并在国内知名赛事与榜单荣获过多项Top2成绩;内部提供充分的交流讨论,现有正式员工与实习同学均来自国内/全球顶尖学校;在这里你会有专业的Mentor实时指导技术创新与业务落地。过去半年团队一共发表论文4篇,AIGC方向专利5项。组内机器资源充足(数百张V100/A100),产研结合,自由度高。组内氛围良好,年轻同学多且有活力,小组内部定期有LOL/桌游/团建旅行。实习表现出色可优先转正及获取SSP Offer。万分期待你的加入!2、实习内容1、多模态视频图文内容理解 (预训练、微调、RLHF、self-prompt技术创新与应用)2、电商多模态信息RAG (商品-商家-用户-平台粒度多维度信息对齐与检索, 跨模态匹配)3、AIGC视觉生成(文生图/视频、精细编辑、多轮交互、训练推理加速、评估标准)4、User Agent设计 (商品知识库信息构建、跨模态实时检索、工具调用与信息分析)5、参与模型蒸馏,量化剪枝,在线实时性部署等工作,支持生成&翻译算法的性能优化与落地;6、针对业务特点,跟踪相关领域的技术发展趋势,进行各类技术方案的探索和学术研究。、当然,研究不限于上述方向,如果您觉得其他方向非常有趣/有价值,也欢迎交流讨论。3、职位要求1、计算机、数学、人工智能或相关专业硕士及博士在读,有扎实的机器学习和NLP算法基础。2、熟悉LLM工程技术和方法,并掌握大模型的微调和评估方法;有参与大模型研发者优先。3、熟悉深度学习框架,如TensorFlow、PyTorch等,有扎实的编程基础和代码实现能力。4、具备优秀的业务感知以及分析和解决问题的能力,良好的沟通协作能力。5、有高水平论文(如ACL、CVPR、NIPS、AAAI、ICML等)或者开源项目者优先。工作地点:杭州 or 北京简历投递:线下私聊
投递快手等公司10个岗位
点赞 评论 收藏
分享
9 48 评论
分享
牛客网
牛客企业服务