字节大模型二面面经

全长25分钟不到,面试官感觉很随意
感觉被kpi了,一个月被两次kpi😅

开头自我介绍+项目简介   5分钟

八股5分钟
1.transformer,encorder-decorder
2.mutihead-attention,qkv矩阵
3.gpt和bert的结构
4.位置编码,transformer和bert和gpt的都问了
5.QLora的原理,量化类型

场景题
1.多个不同长度的句子怎么转为相同长度的embedding,说出用模型和不用模型的方法

2.知道多个词向量怎么表示出整个句子,说出用模型和不用模型的方法

算法题:
三角形最短路径和,类似于杨辉三角,最优解应该是dp,但是最近写dfs比较多,就用dfs写了

感觉面试官很赶时间,一上来节奏很快,八股答得还行,场景题…寄了,算法应该是A了,等结果吧,别第一次面大厂百度和字节都被kpi



更新:已挂,回去沉淀去了
全部评论
是豆包大模型嘛?
点赞 回复 分享
发布于 07-29 18:33 广东
是提前批还是秋招正式批呢
点赞 回复 分享
发布于 07-30 13:20 北京
天翼云科技有限公司
校招火热招聘中
官网直投
楼主是本科还是硕士呀
点赞 回复 分享
发布于 08-01 22:09 江苏
想问下哪里有比较全的大模型八股呢?
点赞 回复 分享
发布于 08-16 18:04 江苏
一上来就问八股 感觉也太kpi了,如果不关注你项目可能基本就挂了 所以也没别在意 就是单纯一开始就不打算要你
点赞 回复 分享
发布于 08-17 10:29 浙江

相关推荐

08-20 23:14
已编辑
门头沟学院 自然语言处理
字节跳动三面281人在聊 查看33道真题和解析
点赞 评论 收藏
分享
腾讯-暑期实习-推荐算法-初试(已offer)暑期实习的面经现在才有空发出来哈哈哈个人背景:双985Timeline:2.25投递,3.4通知初试,3.5初试,3.8复试,3.10 HR面,3.12 HR电话沟通offer,3.15 正式offer邮件面试部门:PCG腾讯会议面了一个半小时,过程如下:1.先简单介绍一下自己。2.挑一个你觉得最能体现你的能力的项目经历展开讲讲。我挑了我正在投稿的论文来讲。然后面试官让我先介绍一下研究任务的背景。因为面试官对我做的任务不了解,所以我几乎是边讲边给他解释一些生疏的概念(在这种时候怎么简短有效地向别人解释新概念就很体现个人表达能力了)。之后就是深挖项目,问的很细,处理的数据集是什么格式,模型输入是什么,样本是什么,模型怎么训练的,full-batch还是mini-batch,有监督还是无监督,数据集太大为什么用 CPU 训练不用 GPU,怎么优化等等(氪金,买 v100 卡、mini-batch、分布式多卡训练)。然后问我 F1-macro 指标怎么计算的(F1是precision 和 recall 的调和平均,F1-macro 和 F1-micro 求平均的计算方式略有不同)。我看你的 AUC 指标挺高的,你觉得这样的性能提升幅度算大吗(AUC 的提升幅度比较小,一点点的提升都是突破)?AUC 指标的数值意义是什么,不用库函数的话具体计算公式是什么(具体计算方式我只记得一个大概的要做排序什么的了,面试官说基本上是这样)。3.对推荐系统感兴趣吗?了解推荐算法吗?(因为我的简历里有写了解具体的推荐算法),自己挑一个算法展开讲讲(我挑了 YouTubeDNN 进行介绍)。然后问 YouTubeDNN 和 DSSM 的区别是什么(我从两者双塔结构的区别、对 Item embedding 处理的区别进行了分析)。4.面试官口头表述出了两道 medium 代码题,都是动态规划:)力扣对应题目见下方。我是直接在 vscode 上写然后讲思路的。5.可以实习多久,什么时候可以开始实习,有在考虑其他公司的机会吗?我说这个不太方面透露,面试官笑了:)所以这个问题一般怎么回答比较好。有什么想问的问题,我问了一下部门的业务方向是什么,面试官说是QQ的部门,做QQ短视频推荐的,然后让我打开QQ看一下就知道了。我打开QQ找了一下才看到,面试官说你是不是把QQ卸了:)我说我平时比较忙,QQ基本上只用聊天功能哈哈哈哈哈哈哈(好吧)。力扣对应题目:【1143. 最长公共子序列】(原题,代码见图片)给定两个字符串 text1 和 text2,返回这两个字符串的最长公共子序列的长度。如果不存在公共子序列,返回 0。一个字符串的子序列是指这样一个新的字符串:它是由原字符串在不改变字符的相对顺序的情况下删除某些字符(也可以不删除任何字符)后组成的新字符串。例如,"ace" 是 "abcde" 的子序列,但 "aec" 不是 "abcde" 的子序列。两个字符串的公共子序列是这两个字符串所共同拥有的子序列。(我直接用二维 dp 秒了,然后面试官问我 text1 和 text2 的当前字符不相等时的状态转移方程求 max 为什么不加一个 dp[i-1][j-1],我还想了一点时间怀疑自己的代码,最后说 dp[i-1][j-1] 的情况已经包含在了 dp[i-1][j] 和 dp[i][j-1] 里了。然后面试官问我如果要求最长公共子序列具体的序列是什么怎么求,然后我就蒙了,思考了很久,觉得可以用 dfs 爆搜,然后还是用 dp 的话可不可以将 dp 数组的 int 改成 string,但是这样字符不相等的时候状态会分裂,所以应该比较难做,最后面试官说把这个当做课后题我回去再思考一下吧)【最长公共子串】(好像没找到 string 类型的原题,但是有数组类型原题【718. 最长重复子数组】,代码见图片)直接把上一题【1143. 最长公共子序列】的求公共子序列改成求公共子串。(面试官还是继续从上面那题展开考我变体,问我把求公共子序列改成求公共子串要怎么求。我一开始还想着用扩展 kmp (z函数) 解,但是发现这样需要把其中一个字符串的所有子串先求出来,多此一举,就还是用二维 dp 秒了。其实代码就是把【1143. 最长公共子序列】的第二个状态转移方程变一下,然后用一个 maxLen 实时更新求到的最长公共子串)复盘:1.前面经过几次面试, 现在对面试的流程和自己的简历内容已经比较熟悉了,但是因为对推荐算法的知识是新学的,所以遗忘很快,需要抽时间复习一下。2.这次直接出了两道中等动态规划题,差点招架不住,因为动态规划真的是我最弱的知识点,动态规划的题只要一难一变化我很容易就歇菜:)所以还是多练练动态规划吧:) #腾讯#  #暑期实习#  #面经#  #算法#
查看4道真题和解析
点赞 评论 收藏
分享
7 39 评论
分享
牛客网
牛客企业服务