深度学习框架研发岗二面,凉凉。。。
1、caffe的框架组成
2、讲一下算子融合,tensorrt中conv和bn的融合原理
3、矩阵相乘加速的算法(winograd)
4、fp16原理?int8量化?
5、说一下卷积和池化,然后给了实例:原本5*5*3的图像,想卷积之后变为2*2*16的图像,你设计一下该怎么做?答使用卷积核4*4个数为3*16,步长为1参数个数也就是4*4*3*16
6、熟悉resnet50、mobilenet、vgg、yolo、inception网络?
7、深度学习框架与硬件适配需要注意哪些?IR啥的。了解TVM如何适配硬件的。
8、分布式训练了解吗?同一个模型在不同gpu上训练,如何保证最终的参数一致,用到什么库函数。
9、生产者和消费者设计模式,任务优先级如何快速处理优先级高的任务?(堆排序,大根堆、小根堆。。)
10、讲一下熟悉的cv模型结构?如yolo网络。。?
11、各类深度学习算法的实现?如:loss函数如何实现的?
12、对gpu芯片架构的了解?
13、深度学习框架的IR了解多少?
14、前端python如何调用后端C++实现的?
15、caffe2了解多少?
16、使用过哪些cuda计算模型?具体举例。。。
1、caffe的框架组成
2、讲一下算子融合,tensorrt中conv和bn的融合原理
3、矩阵相乘加速的算法(winograd)
4、fp16原理?int8量化?
5、说一下卷积和池化,然后给了实例:原本5*5*3的图像,想卷积之后变为2*2*16的图像,你设计一下该怎么做?答使用卷积核4*4个数为3*16,步长为1参数个数也就是4*4*3*16
6、熟悉resnet50、mobilenet、vgg、yolo、inception网络?
7、深度学习框架与硬件适配需要注意哪些?IR啥的。了解TVM如何适配硬件的。
8、分布式训练了解吗?同一个模型在不同gpu上训练,如何保证最终的参数一致,用到什么库函数。
9、生产者和消费者设计模式,任务优先级如何快速处理优先级高的任务?(堆排序,大根堆、小根堆。。)
10、讲一下熟悉的cv模型结构?如yolo网络。。?
11、各类深度学习算法的实现?如:loss函数如何实现的?
12、对gpu芯片架构的了解?
13、深度学习框架的IR了解多少?
14、前端python如何调用后端C++实现的?
15、caffe2了解多少?
16、使用过哪些cuda计算模型?具体举例。。。
全部评论
哪个公司,什么岗位
相关推荐
今天 00:31
上海交通大学 BSP工程师 点赞 评论 收藏
分享
10-28 16:00
大连理工大学 Java 点赞 评论 收藏
分享