中科曙光一二面面经

投的是c++岗,但捞出来的是gpu计算优化。两天速通两面泡池子,发一下面经。

一面
1,cuda的内存结构
2,寄存器的漫溢问题
3,一个线程所需要的寄存器数量是否是越少越好
4,有什么好的方法来规避溢出的问题
 5,cuda编程中共享内存的半个冲突是什么情况
6,cuda流
7,有访问的优化计算方式
8,float4
9,大模型哪些是decoderonly,哪些是encoder-decoder的模型
11,bn和ln的区别

二面
1,cuda如何设计kernal
2,实现两个矩阵的相乘优化
3,lfu机制如何用
4,blockId和blockDim的常见使用场景
5,扩散模型如何抑制去噪的多样化
6,扩散推理过程中如何保证内存的优化使用
7,如何在encoder-decoder中增加跳跃链接加速训练
全部评论
老哥投的哪里的单位,我这一二面中间间隔好大
点赞 回复 分享
发布于 09-25 10:03 辽宁
有手撕吗
点赞 回复 分享
发布于 09-25 15:44 福建
大佬答上来了多少
点赞 回复 分享
发布于 10-08 13:32 广东

相关推荐

好像是有一个考试的,考完了之后很早就进入面试中的流程了,到9.23左右才约面,最后约的9.26一面:1. 自我介绍2. IIC总线3. UART、IIC、SPI、CAN的对比4. 为什么要有Linux系统,怎么看到总线驱动设备这么一套框架5. Linux是怎么去找驱动的6. Linux驱动具体做过些什么7. 具体怎么做Linux驱动开发8. Linux和RTOS的内存管理9. 具体Linux里面是怎么分配内存的10. 怎么映射地址的11. TLB知道吗,具体的虚拟地址到物理地址,怎么找到的,怎么分配的12. 内存分配的算法13. 知道best fit吗?14. 怎么看待内存碎片,怎么合并15. 怎么减少内存碎片的出现16. 是否有办法做到内存碎片不出现17. Linux怎么做内存管理的,跟RTOS有什么区别18. Linux对内存是否有优化的管理算法19. 文件系统20. 进程线程21. 锁的简单理解22. 中断里能不能用互斥锁(这个不太会,但答案是知道的是不行,可以用自旋锁)23. volatile关键字(这个被拷打了很久,我记得是直接从内存读取,但面试官说我说反了,这个我纠结了很久)24. CPU怎么调用函数的25. 函数如何传参26. 内存怎么分配的,会分配成什么样子27. 变量会存在内存的哪里28. 有用过yolo,知道些什么,是否考虑做算法29. 系统启动的具体流程(最后说了STM32的启动过程)30. ST从FLASH启动,为什么是0x08000000(留给SRAM和其他内部RAM)31. 经典反问业务就是做一些芯片的底层开发,也有协议开发,是一个非常大的部门,跟硬件相关的都在这个部门内去完成。一共三面,然后等通知。#秋招##嵌入式##通信硬件人笔面经互助#
查看31道真题和解析 通信硬件人笔面经互助
点赞 评论 收藏
分享
5 20 评论
分享
牛客网
牛客企业服务