首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
Mangogogogo_
2024-03-14 20:37
浙江大学 算法工程师
关注
已关注
取消关注
Megatron-lm 计算tp值
给定模型参数:
模型层数l
模型维度d_model
输入长度seq_len
注意力头head
怎么计算tp
全部评论
推荐
最新
楼层
牛客890255255号
清华大学 人工智能
感觉是和注意力头有关 求答案🤔
点赞
回复
分享
发布于 2024-04-14 00:47
北京
暂无评论,快来抢首评~
相关推荐
03-30 19:55
华为_系统工程师
面试真题 | 网易 嵌入式开发(上)
1.自我介绍 2.讲一下项目主要用了哪些模块或者协议 在嵌入式系统项目中,主要涉及的模块和协议会根据具体应用场景有所不同。以下结合工业控制、物联网、通信接口等典型场景,从硬件模块、软件协议栈、通信协议三个维度进行深度解析: 一、硬件模块 核心控制模块 • ARM微控制器:基于Cortex-M系列(如STM32系列)或Cortex-A系列(如S3C2440)的处理器,承担系统主控任务。例如在工业控制中,S3C2440通过SPI接口连接MCP2510 CAN控制器,实现总线通信。 • 专用协处理器:如DSP用于信号处理(TMS320系列)、FPGA用于实时逻辑控制。 通信接口模块 • 有...
ARM/Linux嵌入式...
点赞
评论
收藏
分享
03-28 14:47
哈尔滨工业大学 产品经理
面试官:产品如何进行大模型选型?
作为AI产品经理,大模型选型需要从业务目标、技术特性和资源投入三个维度进行系统性评估。分步骤的选型:1. 场景需求拆解- 任务类型:区分生成式(GPT)、理解式(BERT)、多模态(CLIP)等任务需求- 性能指标:明确时延要求(如对话场景<2s)、准确率阈值、内容安全等级- 输入输出:处理文本长度(如法律文本需支持10k tokens)、多语言支持需求2. 技术参数评估- 模型架构对比:Transformer层数(如LLaMA 7B vs 13B)、注意力机制差异- 性能基准测试:在HuggingFace OpenLLM Leaderboard等榜单比对MMLU/HELM得分- 领域适配性:检查是否经过垂直领域微调(如Med-PaLM 2医疗专用模型)3. 成本效益分析- 推理成本计算:API调用成本(如GPT-4 $0.03/1k tokens)vs 自建GPU集群成本- 算力需求评估:模型参数量与GPU显存关系(7B模型需至少16G显存)- 长尾运维成本:监控维护、版本迭代、安全补丁更新等隐性成本4. 工程化适配度- 部署方案验证:测试ONNX转换效果、量化后精度损失(INT8量化典型损失2-5%)- 扩展能力测试:分布式推理效率、最大并发请求承载量- 工具链完整性:配套的Prompt工程工具、评估体系、持续训练Pipeline5. 风险合规审查- 数据隐私合规:评估模型训练数据来源合法性(如排除版权争议数据)- 输出可控性:测试有害内容生成概率及防护机制有效性- 许可证审查:确认商用限制(如LLaMA商用需单独授权)6. 迭代路线规划- 短期方案:采用API快速验证(如Azure OpenAI)+ RAG增强时效性- 中期过渡:微调行业小模型(LoRA适配器方案)- 长期演进:构建混合模型架构(大模型+规则引擎+传统ML) #牛客激励计划# #大模型# #大模型面经# #找工作# #聊聊我眼中的AI# #数据人的面试交流地# #AI了,我在打一种很新的工# #产品经理# #牛客AI配图神器#
牛客激励计划
聊聊我眼中的AI
点赞
评论
收藏
分享
03-24 15:30
已编辑
门头沟学院 算法工程师
大模型面经每日总结
BP16 和 FP16 在存储结构、精度表现、数值范围以及适用场景方面有什么不同?训练时使用bf16更稳定,表示范围大,并且自带隐式正则化buffer;推理时使用fp16比bf16更好,因为fp16表示精度高。 https://www.zhihu.com/question/616600181/answer/3194881239怎么解决训练使用float16导致溢出的问题?使用 缩放因子 trick混合精度训练kv-cache的作用一种缓存技术,通过存储键值对的形式来复用计算结果,以达到提高性能和降低内存消耗量化方法的分类按量化对象分:KV Cache量化、模型权重量化、激活值量化-按量化阶段分...
查看6道真题和解析
点赞
评论
收藏
分享
03-26 21:17
北京邮电大学 算法工程师
面壁智能一面
1. (项目的点衍生出来的)RoPE 原理,手撕2. Transformer MHA 手撕3. vLLM为什么能加速?PagedAttention4. CPU/ GPU 架构,为什么设计 GPU5. GPU 硬件架构具体介绍一下6. 发散的问题:怎么看待AGI,怎么看待大模型的“智能”,平时用什么大模型?(回答豆包,感觉应用做的比较好)感觉整体问的还是比较深入的,一个问题可以拓展出很多细节。问题比上午的电信更理论一些,电信更落地更贴近业务(?可能是面试官的仁慈)偏八股吧,美团全是项目…可能是暑期实习和日常实习的差别?
查看6道真题和解析
点赞
评论
收藏
分享
03-15 11:29
已编辑
中共中央党校(国家行政学院)研究生院 Java
BAT集齐?暑期实习面经分享
看之前 帮忙选个offer 能给出理由就更好啦 感谢蚂蚁这个面试官说 主要做风控方向 内部要全面拥抱大模型 我自己简历也是偏向大模型的腾讯 需要转GO 听面试官说是 做 游戏运行平台的运维平台的后台开发 岗位是 《技术运营》感觉低后台一等?不懂字节 需要转GO 财经业务 做 资产证券化 营销之类的 也可以选抖音月付好像 不过HR听我不能3月底到港 OC以后就一直没动静了 腾讯面经看我以前帖子字节一面1.自我介绍2.开始拷打项目中的八股(简历里没有的没问) 2.1 rocketmq一大堆 架构 新特性 新特性谈到 相比kafka更高维度的事务支持 那你谈谈他的事务是如何实现的(...
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
3
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
面试感想:聊透业务拿 Offer
1.5W
2
...
是的,我就是一个眼高手低的废物
5471
3
...
推荐一个0门槛上车AI的机会!!!
5381
4
...
25届秋招复盘:我为什么选择携程?
5291
华为实习进展
热聊中
5
...
挑战全网最早暑期实习!
4748
6
...
理想Java实习一面
4748
7
...
从实习生到参与核心项目:记录我在Keep的2年
4055
8
...
腾讯云智三面暖经90min
3154
9
...
简历泡池子怎么办?
3139
10
...
高德Java一面分享
3068
创作者周榜
更多
正在热议
更多
#
实习进度记录
#
74371次浏览
658人参与
#
第一份工作应该选高薪还是热爱?
#
43836次浏览
420人参与
#
Keep实习校招
#
27019次浏览
183人参与
#
春招进度记录
#
66656次浏览
497人参与
#
你知道哪些职场黑话?
#
27647次浏览
224人参与
#
招银网络求职进展汇总
#
99597次浏览
632人参与
#
地方国企笔面经互助
#
20165次浏览
34人参与
#
风评不好的公司,你会去吗?
#
32548次浏览
161人参与
#
毕业后不工作的日子里我在做什么
#
157171次浏览
1372人参与
#
我的第一份实习怎么找的
#
69466次浏览
692人参与
#
软开人,说说你的烦心事
#
39084次浏览
258人参与
#
24届营销人拿到了几个offer
#
13710次浏览
116人参与
#
机械人值得去的医疗器械企业
#
14141次浏览
38人参与
#
你想吐槽公司的哪些规定
#
13244次浏览
43人参与
#
投格力的你,拿到offer了吗?
#
75276次浏览
552人参与
#
如何用一句话描述你的职业
#
17769次浏览
161人参与
#
去哪儿求职进展汇总
#
122210次浏览
933人参与
#
晒晒你的元宵动态
#
28991次浏览
250人参与
#
诺瓦星云求职进展汇总
#
190467次浏览
1632人参与
#
你的实习什么时候入职
#
164451次浏览
1464人参与
#
我在牛爱网找对象
#
168619次浏览
1249人参与
牛客网
牛客企业服务