金山nlp算法
金山办公
9.26一面 一个半小时
自我介绍
项目,两个都问了
transformer mask如何实现,位置在哪 无限小
self attention结构
bert和gpt区别
如果没有位置编码二者哪个可能能输出正确结果
多核跑python脚本是多线程还是多进程
bn原理及实现
pytorch 的data模块的dataloader dataset samlpe怎么实现及联动
大模型了解多少
对于一个样本极度不均衡的数据,比如正负1:10000,如何设计方法,从数据,采样,模型三个方面解释
手撕算法,难度应该是中
10.12 二面 72分钟
自我介绍
介绍项目 为什么用bert + bilstm + crf 直接用bert微调行不行
负采样除了全局负采样还有什么采样方式(不会)
RLHF 原理
CRF原理
位置编码公式
为什么位置编码要用sin cos(我就答了周期性和有界性,也不会啊呜呜)
bert 的MASK在预测阶段怎么变化
LSTM对比RNN有哪些方面的提升
fasttext 对比 word2vec有哪些提升(忘了..)
深度学习出来之前的语言模型了解过没,就说了个隐马
感觉要寄了,祈祷一波hr
9.26一面 一个半小时
自我介绍
项目,两个都问了
transformer mask如何实现,位置在哪 无限小
self attention结构
bert和gpt区别
如果没有位置编码二者哪个可能能输出正确结果
多核跑python脚本是多线程还是多进程
bn原理及实现
pytorch 的data模块的dataloader dataset samlpe怎么实现及联动
大模型了解多少
对于一个样本极度不均衡的数据,比如正负1:10000,如何设计方法,从数据,采样,模型三个方面解释
手撕算法,难度应该是中
10.12 二面 72分钟
自我介绍
介绍项目 为什么用bert + bilstm + crf 直接用bert微调行不行
负采样除了全局负采样还有什么采样方式(不会)
RLHF 原理
CRF原理
位置编码公式
为什么位置编码要用sin cos(我就答了周期性和有界性,也不会啊呜呜)
bert 的MASK在预测阶段怎么变化
LSTM对比RNN有哪些方面的提升
fasttext 对比 word2vec有哪些提升(忘了..)
深度学习出来之前的语言模型了解过没,就说了个隐马
感觉要寄了,祈祷一波hr
2023-10-12
在牛客打卡1天,今天也很努力鸭!
全部评论
一面问的简直一模一样😂,二面我的超简单,我给面试官讲了40分钟我的论文课题
我是cv岗,今天刚二面,八股+项目拷打,八股有些问的太奇怪了不太会😭
相关推荐