球球了给我一个offer

2023-10-30 08:17 门头沟学院算法工程师

关注

海信一面面经

1.BN和LN的区别

2.什么情况下会发生梯度爆炸，如何解决（我们初始化的w是很大的数，w大到乘以激活函数的导数都大于1，那么连乘后，可能会导致求导的结果很大，形成梯度爆炸。梯度截断：首先设置梯度阈值：clip_gradient，在后向传播中求出各参数的梯度，不直接用梯度进行参数更新，求梯度的L2范数，然后比较范数||g||与clip_gradient的大小，如果范数大，求缩放因子clip_gradient/||g||，由缩放因子可以看出梯度越大，缩放因子越小，就可以很好的控制梯度的范围。最后将梯度乘以缩放因子得到最后需要的梯度。L1范数是指向量中各个元素绝对值之和，L2范数是指向量各元素的平方和然后求平方根。

2、可以通过添加正则项，避免梯度爆炸。正则化是通过对网络权重做正则限制过拟合，仔细看正则项在损失函数的形式：regularization 公式：

Loss=(y−WTx)2+α∣∣W∣∣2,其中,α 是指正则项系数，因此，如果发生梯度爆炸，权值的范数就会变的非常大，通过正则化项，可以部分限制梯度爆炸的发生。

  3、使用LSTM等自循环和门控制机制，避免梯度消失

  4、优化激活函数，譬如将sigmold改为relu，避免梯度消失）

  5、使用残差网络，避免梯度消失

3.网络收敛很慢可以用什么方法解决：

为了解决收敛速度慢的问题，我们可以从以下三个方面入手：

数据预处理：对于训练数据，可以尝试进行数据清洗、增强、扩充等操作，以提高数据的质量，减少噪声和不平衡现象，从而帮助模型更快地收敛。

优化模型：可以根据任务需求，选择合适的模型结构，避免过度复杂化，以减少计算量和训练时间。同时，可以考虑引入正则化、dropout等技术，以防止过拟合，提高模型的泛化能力。

改进训练代码实现：可以选择合适的优化算法，如随机梯度下降（SGD）、Adam等，并合理设置学习率和批量大小，以加快训练速度。同时，可以尝试使用并行化、分布式等方法，利用多GPU或者多机进行训练，以提高计算效率。
4.dropout为什么能起到正则化
5.用了什么优化器，Adam的原理是什么，Adam为什么可以自适应调节
6.数据量很大的话怎么构建图神经网络
目前状态是在等企业文化面，但面的时候感觉答的不是很好

全部评论

推荐最新楼层

千斗五十铃

天津大学算法工程师

。。。为什么问得这么八股

点赞回复分享

发布于 2023-10-30 12:35 天津

北京理工大学算法工程师

再加点计算推导比得上字节了

点赞回复分享

发布于 2023-10-30 16:26 北京

喜欢飞来飞去的青提向光而行

门头沟学院单证员

lz昨天电话面试的吗，现在状态是啥了？

点赞回复分享

发布于 2023-10-31 13:14 上海

10-31 13:24

浙江工业大学嵌入式硬件工程师

想问一下双非本（本地的重点）的测试一般要税前或者到手多少正常？都是算中大厂，有加班，谈薪的时候就是说自己的意向就结束了嘛？硬件测试比软件测试能多要点吗？

点赞评论收藏

分享

11-06 08:09

已编辑

门头沟学院自然语言处理

淘天集团-LLM算法日常实习生招聘

【LLM算法实习生招聘】【部门介绍】淘天集团供给智能团队定位于淘系供给侧（商家/商品/行业）业务场景，以AI能力为核心驱动的技术团队。【岗位描述】参与大语言模型前沿算法研发工作：专注于围绕OpenAI o1相关工作的背景技术探索：包括不限于技术探索、算法复现、技术创新等。提升大模型的Reasoning、Planning、Tool using、Reflection、Self-play等能力。【基本要求】1、计算机或相关专业硕士及以上学历；2、对大模型新技术感兴趣，具有良好的英文阅读能力和写作能力，有英文论文写作/发表经验；3、了解前沿NLP大模型算法知识，有模型训练经验。4、出色的问题解决能力和创新能力，能够解决复杂的技术挑战；5、实习时间6个月或以上。【具备以下条件优先】1、有ACL等顶会论文发表经验；2、熟悉大模型推理优化、自主学习或强化学习算法、了解OpenAI o1相关工作。【岗位亮点】1. 资源丰富，有AI相关成熟产品，2. 团队氛围轻松，师兄师姐对新人负责。3. 表现优秀者，有转正机会。【投递渠道】有意向者可投递简历至**********，一个工作日内回复。引流 #阿里#  #开奖#  #淘天2025秋招#    #实习生#  #算法#  #LLM#  #大模型#  #o1#  #GPT4#

投递淘天集团等公司10个岗位

点赞评论收藏

分享

11-20 15:46

华南理工大学后端

拼多多2025校招面经内推

最近我参加了互联网大厂的面试3 月 9 日下午 1：00 一面自我介绍+介绍项目项目中难点及解决办法Java 线程的状态及转换Java 创建线程的方式创建线程池的方式有哪些JUC 包下的类，能说多少说多少ReentranLock 与 sychronized 的区别volitile 的内存语义，底层如何实现解释一下 happens-before，有哪些规则CurrentHashMap 源码MySQL 的索引及区别算法题：顺时针打印矩阵3 月 10 日下午 1:00 二面，深挖项目为主(45min) 介绍项目，项目中的难点(15min)MySQL 是如何优化的，数据量有多少倒排索引与正排索引的区别...

点赞评论收藏

分享

10-27 18:50

西安交通大学算法工程师

算法实习面经--求好运

10.25 镁佳（北京）科技有限公司—一面14：001.Dropout机制2.Self-attention中的计算方法3.Kv/squr(t)为什么要除以squr(t)4.为什么要有position embedding5.如何解决decoder-attention中无法看到后面信息的问题：mask matrix6.Bert主要用来干什么？Next sentence perdiction 和 Mask 位置填补总体来说就是死扣transformer编码题：二分查找用2个栈实现队列10.25 镁佳（北京）科技有限公司—二面17：00查看CPU使用情况：top(实时监控工具)查看端口占用情况：netstat -tuln  # -tuln：列出所有监听的 TCP 和 UDP 端口显示系统内存的总量、已用量、空闲量以及缓存和缓冲区的使用情况：free -h查看GPU使用情况：nvidia-smi特别细致地提问上一段的经历，算法让我输入每一步骤的输入和输出logistic回归：y=1/(1+e(wx+b) 其中y也可以表示成P(X编码题：将列表中的0元素，其他按正常的顺序排列，提到列表前面10.27 货拉拉——一面11：00询问项目经历聚类方法K means支持向量机对过拟合的理解，以及如何解决过拟合。编码题：快速排序（找基准的那个排序方法）感觉货拉拉的面试还是挺中规中矩的

查看11道真题和解析

点赞评论收藏

分享

11-06 17:00

福州大学算法工程师

金山算法oc的小伙伴

可以私聊我一下，我拉着大火一起交流一下

点赞评论收藏

分享

3 20 评论

全站热榜

正在热议

# 25届秋招总结 #

299329次浏览 2647人参与

# 如果不工作真的会快乐吗 #

58912次浏览 515人参与

# 北方华创开奖 #

26434次浏览 285人参与

# 地方国企笔面经互助 #

3734次浏览 9人参与

# 美团求职进展汇总 #

1326784次浏览 12446人参与

# 选完offer后，你后悔学本专业吗 #

19691次浏览 143人参与

# 阿里云管培生offer #

16897次浏览 294人参与

# 正在实习的你，几点下班 #

51670次浏览 387人参与

# 国央企薪资爆料 #

8077次浏览 67人参与

# 如何一边实习一边秋招 #

991920次浏览 12638人参与

# 提前批简历挂麻了怎么办 #

146366次浏览 1948人参与

# 学历or实习经历，哪个更重要 #

50883次浏览 401人参与

# 海康威视求职进展汇总 #

398687次浏览 3405人参与

# 米哈游求职进展汇总 #

175811次浏览 1458人参与

# 投递实习岗位前的准备 #

1178959次浏览 18392人参与

# 面试体验感最好的是哪家？ #

85027次浏览 845人参与

# 实习生应该准时下班吗 #

167368次浏览 1159人参与

# 得物求职进展汇总 #

66168次浏览 682人参与

# 求职遇到的搞笑事件 #

70713次浏览 576人参与

# 网申一定要掌握的小技巧 #

5310次浏览 53人参与

# 0offer是寒冬太冷还是我太菜 #

897936次浏览 8009人参与

# 腾讯求职进展汇总 #

195721次浏览 1641人参与

牛客网
牛客企业服务