纠结的变色龙躺平又起来了

09-10 08:11 浙江大学自然语言处理发布于北京

关注

百度自然与语言处理二面凉经

具体是做大模型训练套件的中台组，所以很考察涉及大模型内部计算的细节。

1.自我介绍
2.手撕和最大的连续子序列
3 写一个多头注意力 reshape transpose
4 为什么要使用多头注意力更多的qkv嵌入更好的表达能力
5 单头注意力和多头注意力计算量比较。多头略多一些，具体应该是多在多头注意力concat之后的又一次线性变换上。这题当时没答对。
6 为什么使用gqa，gqa的好处有啥。略微减少参数量，均衡性能并减少kv cache的压力。
7 为什么是kv cache 而不是qv cache。我理解是，如果是qv cache，这东西能算的注意力是最后一列而不是最后一行，这种计算甚至是反因果系统这个前提的，我感觉我的解释有道理，但面试官不满意，可能有更好的答案。
8 lora具体为什么能减少计算过程中的显存占用，具体减少在那部分上了？我认为权重和前向过程中的激活值在加上lora之后，整体也不会少太多，那么少的只能是来自梯度和优化器状态，其中大头是优化器状态。
9 拷打Megatron中的张量并行都存在哪些地方，具体如何做张量并行，当时没太完全看透Megatron（虽然现在也没看透），所以这题直接爆炸了。
10 具体来说Megatron在transformers中的张量并行，可以发生在mlp，attention，embedding，cross entropy这几块。在mlp上，存在一个因为非线性变换，而对两个矩阵乘中的右侧矩阵列split，左侧矩阵不切的方式进行并行，减少一个同步点。attention中的并行主要是对头并行。embedding和cross entropy中这是要减少vocab这个超大纬度给计算带来的压力，做vocab纬度的张量并行。
11 见我Megatron 张量并行打的不是很好，可能是想引导一下，面试官问我长文本训练中，需要算loss的token很多，怎么缓解这个过程的计算压力，我觉得他当时想引导我讲cross entropy的张量并行的，但我当时没想到。

反问很套路的了解部门业务

结果面完秒挂 😭

#如何判断面试是否凉了# #百度求职进展汇总# #互联网没坑了，还能去哪里？#

全部评论

推荐最新楼层

希望有好offer

百度_nlp/llm(实习员工)

问的很细节

点赞回复分享

发布于 09-10 10:55 北京

门头沟学院算法工程师

问的好难啊

点赞回复分享

发布于 09-10 12:55 陕西

哈尔滨市第九中学算法工程师

7 下一个token是q，存qv cache没用。8 考虑全精度，少梯度，优化器一阶，二阶和activation 另外佬对3D和4D并行有啥经验分享吗，不知道有没有模板分法

点赞回复分享

发布于 09-14 07:05 北京

想奋斗的母单花在研究求职打法

东南大学机器学习

同二面挂，应该是同一个组

点赞回复分享

发布于 09-15 22:40 江苏

11-21 08:55

华南师范大学游戏运营

陌陌产品运营一面

自我介绍。能否详细讲述一下你简历上的项目背景，以及你是如何获得这些机会的？主修哪些课程？专业技能是通过课堂学习还是自学？你对产品运营的工作内容了解多少？目前手机中使用较多的APP有哪些？你觉得它们有趣的地方在哪里？你是否使用过陌陌、Soul等软件？使用体验如何？在生活或工作中，你接触过哪些AI产品或工具？是如何使用它们的？你有做过自媒体平台的账号吗？你有什么问题想问我们？

查看11道真题和解析非技术面试记录

点赞评论收藏

分享

10-25 19:28

大连理工大学 Java

自我介绍接口压测90%分位点耗时主要在哪里生成唯一id的方法有哪些雪花算法是多少位怎么用redis生成唯一idredis缓存一致性怎么保证redis缓存未命中怎么处理（回答分布式锁）使用分布式锁会带来什么问题，怎么解决怎么做分库分表为什么要使用rocketmq实习期间工作全程30分钟，无手撕，感觉凉了

查看11道真题和解析

点赞评论收藏

分享

10-25 14:00

中国科学院大学自然语言处理

小米nlp开奖了吗？

如题，12号面试完，等的很着急😣

点赞评论收藏

分享

10-31 10:06

已编辑

南京理工大学 Java

已oc，耀孝子启动！急急急，IT应用开发耀子啥时候开呀嘤嘤嘤] #荣耀求职进展汇总# #荣耀# #荣耀校招# #荣耀开奖# #荣耀池子#

什么时候能oc：昨天有人开了

荣耀求职进展汇总

点赞评论收藏

分享

11-21 08:20

北京大学嵌入式软件开发

面试不慌张,必须掌握的面经

1. 如何在嵌入式系统中实现任务优先级的静态调度？2. 在STM32中配置SPI进行数据传输？3. 嵌入式系统中如何实现实时操作系统（RTOS）的时间片轮转调度？4. 如何在嵌入式系统中实现光照传感器的数据采集？5. 在FreeRTOS中使用互斥量进行任务间资源保护？6. 嵌入式系统中如何实现SD卡文件系统的操作？7. 在STM32中配置DMA进行USART接收？8. 如何在嵌入式系统中实现AES加密和解密？9. 在RT-Thread中使用软定时器进行定时任务？10. 嵌入式系统中如何实现UART与CAN的互操作？11. 如何在嵌入式系统中实现低功耗模式？12. 在STM32中配置和使用RTC的闹钟功能？13. 嵌入式系统中如何实现多路复用ADC采集？14. 在FreeRTOS中实现任务优先级的静态调整？15. 如何在嵌入式系统中实现音频信号的录制与播放？16. 在STM32中配置和使用OLED显示模块？17. 嵌入式系统中如何实现NTP时间同步？18. 在RT-Thread中使用消息队列进行数据传输？19. 如何在嵌入式系统中实现GPIO边缘触发中断？20. 在STM32中配置并使用定时器产生PWM信号？21. 嵌入式系统中如何实现数据的哈希校验？22. 在FreeRTOS中实现任务的优先级反转解决方案？23. 如何在嵌入式系统中实现图像处理算法？24. 在STM32中配置和使用外部中断的优先级？25. 嵌入式系统中如何实现温湿度传感器的校准？26. 在RT-Thread中实现定时器的精确控制？27. 如何在嵌入式系统中实现蓝牙通信？28. 在STM32中使用外设定时器生成正弦波？29. 嵌入式系统中如何实现数据的CRC32校验？30. 在FreeRTOS中实现任务的动态创建与删除？我面试看的是大佬的面经，链接放下边了  c++/嵌入式面经专栏-牛客网 https://www.nowcoder.com/creation/manager/columnDetail/MJNwoM

点赞评论收藏

分享

6 28 评论

招聘动态

字节跳动

2025校园招聘

杉川机器人

2025校园招聘

快手Star

2025届招聘

快手

销售类投递专区

库洛游戏

全站热榜

正在热议

# 25届秋招总结 #

256668次浏览 2102人参与

# 学历or实习经历，哪个更重要 #

42438次浏览 315人参与

# 北方华创开奖 #

23327次浏览 260人参与

# 地方国企笔面经互助 #

2743次浏览 7人参与

# 0offer是寒冬太冷还是我太菜 #

884622次浏览 7885人参与

# 选完offer后，你后悔学本专业吗 #

12312次浏览 85人参与

# 应届生被毁约被毁意向了怎么办 #

27756次浏览 242人参与

# 你最想要的公司福利是？ #

41101次浏览 137人参与

# 查收我的offer竞争力报告 #

18094次浏览 239人参与

# 如何一边实习一边秋招 #

986410次浏览 12602人参与

# 一觉醒来，我觉醒了超级打工人系统 #

3175次浏览 36人参与

# 面试体验感最好的是哪家？ #

83400次浏览 814人参与

# 机械应届生薪资要多少才合适？ #

12499次浏览 60人参与

# 如何写一份好简历 #

603862次浏览 8480人参与

# 嵌入式转岗的难度怎么样 #

11067次浏览 250人参与

# 秋招OC许愿 #

227510次浏览 1877人参与

# 秋招被确诊为…… #

58896次浏览 315人参与

# 来聊聊机械薪资天花板是哪家 #

65026次浏览 440人参与

# 你觉得第一学历对求职有影响吗？ #

14966次浏览 121人参与

# 面试题刺客退退退 #

137726次浏览 2093人参与

# 总结:哪家公司面试体验感最差 #

26045次浏览 130人参与

牛客网
牛客企业服务