字节算法面试记录

8.29 一面 50min

1.拷打论文 (面试官反馈,讲的很清楚)
2.拷打实习
3.LoRA原理
4.对Seq2Seq模型的理解
5.self-attention原理
6.位置编码,LLM用的是什么?为什么这么设计?
7. RAG了解吗?讲下RAG链路?RAG为什么有用?
8. RAG向量召回怎么做的?
9. 手撕——删除链表倒数第n个节点(从class开始实现, 有个地方有bug, 不过面试官说ok)
10. 反问

9.4 二面 60min

1. 开局手撕——反转链表(也是从class开始实现,自己写样例测一下)
2. 拷打实习
3. 你做了哪些优化?效果怎么样?为什么有效果? (感觉面试官不是很相信)
4. 讲一下PPO
5. 大模型幻觉是怎么产生的?最新的paper有看过吗?
6. 怎么缓解幻觉?
7. 手里项目上线了吗?下一步优化点是什么?
8. 可以提前实习吗?
9. 反问

许愿🙏🙏🙏🙏 #不给转正的实习,你还去吗#  #面试#  #字节#  #秋招#  #算法#  #面经##阿里##腾讯# #蚂蚁##美团##小红书#
———————————————
updare一下,g了
全部评论
字节寿司比较简单,请问佬们这是正面信号吗?
1 回复 分享
发布于 09-04 22:01 四川
感觉这个问的也还行,怎么会挂了的
点赞 回复 分享
发布于 09-09 18:54 浙江
请问是哪个部门啊?抖音生活服务吗
点赞 回复 分享
发布于 09-16 18:08 北京
二面的面试拽吗?
点赞 回复 分享
发布于 09-17 16:29 浙江
一面之后多久约的二面呀?
点赞 回复 分享
发布于 10-13 19:39 湖北

相关推荐

( 发的有点晚,上个月面的面试官属于慢慢引导你的那种,气氛很融洽;hr也很热心;公司第一印象宽敞且舒适问的问题:0. 把我当成小白,给我讲一个你觉得做的比较好的项目讲的是自己做的那个大模型RAG应用,但是实际上讲的比较混乱,重新梳理后核心就这几个东西- Prompt:提问 & 提示词- Embedding:词嵌入- similarity_research:向量匹配- Rerank:结果过滤追问:Embedding的过程具体起到什么用答的不好1. Embedding 过程实际上是将高维、离散的数据映射到低维、连续的向量空间中。这种映射旨在保持数据在原始空间中的相似性,使得在向量空间中相近的嵌入向量表示的数据在原始空间中也是相似的。2. 过程a. 初始化首先,需要定义嵌入向量的维度(即每个数据点将被映射到的向量的大小)。然后,通常随机初始化一个嵌入矩阵,其行数等于数据集中唯一数据点的数量,列数等于嵌入向量的维度。b. 学习在训练过程中,嵌入矩阵是通过优化一个目标函数来学习的。这个目标函数通常与任务相关,比如在推荐系统中,可能希望相似的物品有相近的嵌入向量。通过梯度下降等优化算法,模型会更新嵌入矩阵中的权重,使得相似的输入数据在嵌入空间中靠近,而不相似的则远离。c. 优化在学习过程中,可能会应用一些技巧来改善嵌入的质量,如使用负采样、正则化、dropout等。d. 应用一旦嵌入向量被学习好,它们就可以用于各种下游任务,比如文档相似度计算、推荐系统、图像分类等。1. http和https的区别,https相比于http,安全性体现在哪方面没复习,就记得ssl和ca了区别:- 加密:http不加密,使用明文传输;https使用ssl和tls加密- 认证:https通过证书验证服务器身份- 端口:80,443安全性:- https采用对称加密和非对称加密结合的方式- https采用CA验证服务器身份- 通过hash或mac(消息认证码)来保证数据完整性- 序列号机制,防止重复信息的发送2. 浏览器缓存没复习到,忘了强缓存:浏览器直接使用本地缓存,不与服务器交互,直到缓存过期。(字段:Expires,Cache-Control)协商缓存:浏览器每次请求资源都会与服务器进行通信,通过对比资源的修改状态来决定是否使用缓存。(字段:Last Modified,Etag)3. 为什么项目使用JWT而不使用Sessions作为认证?当时设计时没考虑到JWT组成:- head,通过base64编码- payload,指定算法加密- signature,指定密钥JWT的特点:无状态,无需储存在服务器中,但是需要进行解码运算,跨域支持好;适合频繁认证的场景Session的特点:存储于服务器,有状态;灵活性高,可以随时删除,跨域支持一般;适合低频认证、需要高安全性的场景4. tailwind对性能优化体现在什么方面按打包方面发挥了,这方面没做过功课有三个方面:浏览器:JIT辅助开发打包:purge、tree-shaking等减少打包体积开发:减少重复代码的书写、减少记忆成本5. 按输入监听即时查询的输入框和鼠标点击搜索才进行查询的输入框你认为他们各自在什么场景更合适憋了一会,答的是三个因素- 搜索条件数量与复杂度- 搜索词与匹配词之间的匹配精确/模糊程度- 服务器性能开销查了查还有其它方面可以说- 用户体验(用户习惯 / 搜索体验 / 搜索效率 / 用户辅助-即时搜索与自动补全)- 安全性(即时搜索会暴露更多的数据)6. 讲讲你对闭包的理解7. 讲一讲http接口(get,post)非技术上,面试官给我的建议(主要是自己比较紧张- 手部动作有点多- 声音可以适当放大一点我个人感觉到的自己的问题- 逻辑角度讲的有些多,往后才慢慢回到技术角度我整体上答得都一般,但是面试体验很好Update:应该是被刷KPI了,快一个月没消息了,这也让我反思了一下随意和融洽这两个词的区别目前已入职另一家公司
查看9道真题和解析
点赞 评论 收藏
分享
9 38 评论
分享
牛客网
牛客企业服务