首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
在学c语言的悲伤蛙很有气魄
门头沟学院 市场
发布于江苏
关注
已关注
取消关注
@RockyDing:
算法面试高频知识点:模型部署总结
----【模型部署】---- 【一】模型压缩的必要性与可行性? 模型压缩是指对算法模型进行精简,进而得到一个轻量且性能相当的小模型,压缩后的模型具有更小的结构和更少的参数,可以有效降低计算和存储开销,便于部署在端侧设备中。 随着AI技术的飞速发展,不管是移动端产品还是线上产品,进行AI赋能都成为了趋势。这种情况下,AI算法的实时性与减少内存占用都显得极为重要。AI模型的参数在一定程度上能够表达其复杂性,但并不是所有的参数都在模型中发挥作用,部分参数作用有限,表达冗余,甚至会降低模型的性能。 【二】X86和ARM架构在深度学习侧的区别? AI服务器与PC端一般都是使用X86架构,因为其高性能;AI端侧设备(手机/端侧盒子等)一般使用ARM架构,因为需要低功耗。 X86指令集中的指令是复杂的,一条很长指令就可以很多功能;而ARM指令集的指令是很精简的,需要几条精简的短指令完成很多功能。 X86的方向是高性能方向,因为它追求一条指令完成很多功能;而ARM的方向是面向低功耗,要求指令尽可能精简。 【三】FP32,FP16以及Int8的区别? 常规精度一般使用FP32(32位浮点,单精度)占用4个字节,共32位;低精度则使用FP16(半精度浮点)占用2个字节,共16位,INT8(8位的定点整数)八位整型,占用1个字节等。 混合精度(Mixed precision)指使用FP32和FP16。 使用FP16 可以减少模型一半内存,但有些参数必须采用FP32才能保持模型性能。 虽然INT8精度低,但是数据量小、能耗低,计算速度相对更快,更符合端侧运算的特点。 不同精度进行量化的归程中,量化误差不可避免。 在模型训练阶段,梯度的更新往往是很微小的,需要相对较高的精度,一般要用到FP32以上。在inference的阶段,精度要求没有那么高,一般F16或者INT8就足够了,精度影响不会很大。同时低精度的模型占用空间更小了,有利于部署在端侧设备中。 【四】GPU显存占用和GPU利用率的定义 GPU在训练时有两个重要指标可以查看,即显存占用和GPU利用率。 显存指的是GPU的空间,即内存大小。显存可以用来放模型,数据等。 GPU 利用率主要的统计方式为:在采样周期内,GPU 上有 kernel 执行的时间百分比。可以简单理解为GPU计算单元的使用率。 【五】神经网络的显存占用分析 Float32 是在深度学习中最常用的数值类型,称为单精度浮点数,每一个单精度浮点数占用4Byte的显存。 在整个神经网络训练周期中,在GPU上的显存占用主要包括:数据,模型参数,模型输出等。 数据侧:举个🌰,一个323128128的四维矩阵,其占用的显存 = 323128128*4 /1000 / 1000 = 6.3M 模型侧:占用显存的层包括卷积层,全连接层,BN层,梯度,优化器的参数等。 输出侧:占用的显存包括网络每一层计算出来的feature map以及对应的梯度等。 【六】影响模型inference速度的因素? FLOPs(模型总的加乘运算) MAC(内存访问成本) 并行度(模型inference时操作的并行度越高,速度越快) 计算平台(GPU,AI协处理器,CPU等) 【七】为何在AI端侧设备一般不使用传统图像算法? AI端侧设备多聚焦于深度学习算法模型的加速与赋能,而传统图像算法在没有加速算子赋能的情况下,在AI端侧设备无法发挥最优的性能。 【八】减小模型内存占用有哪些办法? 模型剪枝 模型蒸馏 模型量化 模型结构调整 【九】有哪些经典的轻量化网络? SqueezeNet MobileNet ShuffleNet Xception GhostNet 【十】模型参数计算? 首先,假设卷积核的尺寸是,有个特征图作为输入,每个输出的特征图大小为,输出为个特征图。 由于模型参数量主要由卷积,全连接层,BatchNorm层等部分组成,我们以卷积的参数量为例进行参数量的计算分析: 卷积核参数量: 偏置参数量: 总体参数量: 【十一】模型FLOPs怎么算? 同样,我们假设卷积核的尺寸是,有个特征图作为输入,每个输出的特征图大小为,输出为个特征图。 由于在模型中卷积一般占计算量的比重是最高的,我们依旧以卷积的计算量为例进行分析: FLOPS(全大写):是floating point operations per second的缩写,意指每秒浮点运算次数,理解为计算速度。是一个衡量硬件性能的指标。 FLOPs(s小写):是floating point operations的缩写(s表示复数),意指浮点运算数,理解为计算量。可以用来衡量算法/模型的复杂度。 针对模型的计算量应该指的是FLOPs。 在上述情况下,卷积神经网络一次前向传播需要的乘法运算次数为: 同时,所要进行的加法计算次数分为考虑偏置和不考虑偏置: (1)考虑偏置的情况: 为了得到输出的特征图的一个未知的像素,我们需要进行$K\times KK\times K - 1$次加法,由于有C个通道,所以需要将结果乘以C,每个通道间的数要相加,所以需要C - 1次加法,最后再加上偏置的1次加法。 所以总的加法计算量如下: 所以总的卷积运算计算量(乘法+加法): (2)不考虑偏置的情况: 总的卷积计算量:
点赞 23
评论 3
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
04-25 12:55
游卡_运营_HR
游卡春招
很多同学问还有没有春招,我说你现在直接投就行了,别问,把秋招投过的再投一遍,你进面率至少比秋招高50% 春招现在就是捡漏,不要畏手畏脚,再不投就毕业失去应届生身份了!入职游卡也有段时间了了,说说卡子的上班感受,毕竟如果我自己都感受不好,也没啥动力推荐大家来了大家可能更熟悉它的“三国杀”,在游戏圈里也算是个老牌子了。公司总部在上海闵行区虹桥国际商务广场,办公环境还不错,交通也挺方便。工作时间是早上9点到下午6点,双休,弹性工作制。福利方面,五险一金、补充医疗、定期体检这些都有,餐补是25块一天,社保公积金公司和个人各12%。整体来说,福利还算可以,公司里有不少海归硕士,薪资水平也相...
游卡公司福利 168人发布
点赞
评论
收藏
分享
04-27 07:41
清华大学 BSP工程师
网易 嵌入式开发 一面凉经
攒攒人品。 1.自我介绍 2.讲一下项目主要用了哪些模块或者协议 4.详细讲下电机调试 5.串口相关,波特率计算,115200下数据吞吐量(1ms多少数据) 7.CAN通信1m情况下,扩展帧满帧的时候1ms有多少包 8.做CAN开发crc校验帧会关注吗 9.会手动校验CRC吗,32上CAN的CRC校验怎么做的 10.CAN的ID,data,crc多少帧 11.之前一直在做测开,为什么想投嵌入式 12.Linux下BSP有用过吗 13.Linux下编程有接触吗 14.操作系统间进程的消息是怎么传递的 15.Freertos的调度是通过哪个中断进行的 16.在哪个中断进行一次任务管理的 17.在f...
网易一面39人在聊
查看25道真题和解析
通信/硬件秋招总结
点赞
评论
收藏
分享
04-22 15:13
已编辑
Java
两周了,估计是凉了
HR劝我先签一个保底,我估计是没HC了#新凯来求职进展汇总# #新凯来# 更新:录用评估未通过,终于不用痛苦的等待了
强大的麻辣烫愿offer多多:
今天也和我说没hc了
新凯来求职进展汇总
点赞
评论
收藏
分享
03-03 13:52
门头沟学院 嵌入式软件开发
公司确实得背调
各位牛友们,希望简历要如实写,公司确实会背调的
牛客840099999号:
没见过这样的大厂,至少头部的肯定没有
点赞
评论
收藏
分享
04-25 15:18
CVTE_运营管理_HR
春招是这样的
1.临近毕业,写论文、准备答辩、拍毕业照等一系列事情等着你处理。这个时候很看重大家对时间的分配能力,排好优先级。2.春招的主力军其实是考研、考公失利后临时加入求职大军的同学,还有之前秋招没拿到满意 offer 的人,不少同学都有了秋招的经验,面试技巧更加老道!别自我感动,觉得自己还不错了。3.春招岗位比秋招少,而且质量会更差一些,别指望春招能像秋招一样有大把核心岗位任你挑选。很多企业在秋招时基本已经完成了大部分人才储备。4.别“挑肥拣瘦”,春招岗位少,别再“大厂非去不可”,中小厂也有好机会,说不定能给你更多成长空间。总之先上车,再换车。直入主题,大家都关注的问题cvte加不加班?加还是加的,但...
CVTE公司福利 459人发布
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
大连某小区保安一面
2.6W
2
...
滴滴秋储后端
1.7W
3
...
如果你的项目是烂大街rpc,面试该怎么吹?
1.4W
4
...
北京到底有谁在啊?
1.2W
5
...
妈妈,我被应届生身份压得喘不过气
1.0W
6
...
美团/饿了么/京东 配送端面经
9834
7
...
五一别写你那破开源代码了
9264
8
...
所以,你们许给我们的远大前程呢
8208
9
...
想听实话吗,校招ssp聊聊大厂客户端
7955
10
...
爱谁谁吧!暑期实习,老娘再也不面了!
7721
创作者周榜
更多
正在热议
更多
#
领导秒批的请假话术
#
3757次浏览
26人参与
#
五一之后,实习真的很难找吗?
#
37506次浏览
238人参与
#
平安产险科技中心求职汇总
#
247030次浏览
2629人参与
#
材料专业哪个方向更好找工作?
#
17939次浏览
89人参与
#
如果有时光机,你最想去到哪个年纪?
#
42818次浏览
765人参与
#
如何缓解入职前的焦虑
#
168817次浏览
1251人参与
#
扒一扒那些奇葩实习经历
#
39657次浏览
752人参与
#
你想留在一线还是回老家?
#
30202次浏览
381人参与
#
面试等了一周没回复,还有戏吗
#
113629次浏览
1057人参与
#
应届生薪资多少才合理?
#
2824次浏览
24人参与
#
考研可以缓解求职焦虑吗
#
19062次浏览
237人参与
#
求职遇到的搞笑事件
#
104300次浏览
730人参与
#
你喜欢工作还是上学
#
36448次浏览
401人参与
#
入职第一天,你准备什么时候下班
#
44966次浏览
290人参与
#
许愿池
#
270479次浏览
2842人参与
#
经纬恒润求职进展汇总
#
115783次浏览
1021人参与
#
视觉/交互/设计百问百答
#
39730次浏览
418人参与
#
大疆的机械笔试比去年难吗
#
69407次浏览
599人参与
#
考研失败就一定是坏事吗?
#
98934次浏览
826人参与
#
机械人求职现状
#
13549次浏览
122人参与
#
硬件人,你被哪些公司给挂了
#
46154次浏览
713人参与
牛客网
牛客企业服务