回馈一波牛客,很多面的算法面经验

XX公司面经:
1面:
没问啥,没什么深度,广度有一点吧
dropout
树模型
数据过拟合
fm
问简历
两个题:
第一个:二叉树层次遍历
第二个:求1到n中每一个数 在二进制表达中1的个数

二面:
扯了一下auc的计算方法,大概是 (piar-对中正例prob>负例prob的个数)/(正例个数*负例个数)
sigmoid  求导 优点
树模型说一下
算法题:
求链表倒数第k个节点值


XX公司:
一面:
问项目和实习,偏介绍干了什么,bert中的kqv在XX项目中的对应

机器学习部分:
问lr 与softmax的区别
softmax 减去最大数字不变的证明
booting和baging 在物理上的意义
crf  hmm图

问题:
开根号n的近似计算


二面:
问了下crf为什么比bert效果好(XX项目)
其他的偏介绍

试题:
固定长度(3,4,5)的青蛙过河[1 4 5 7 10]  [1 6 7 10]

三面:
主要介绍实习,偏重于问为什么这么做
问题:
区间[a,b]里面不包含数字 3,5 ,7 的数字的个数

((a+b)*c) 中不包含*/的括号的个数。

四面:
bert训练过程,一个例子,两个loss
分词问题对分类问题有什么帮助
普通机器学习模型为什么不用二阶信息
全正的数据,预测出来了负样例,为什么
算法题: 最小乘积子数组

五面:
算法复杂度
加入词典信息的ner具体做法
算法题: 100w个数求中位数

XX公司:
l1是损失函数,有哪些优化方法,能用sgd么?为什么?

l1是不可导的,真的可以用么?

adam用到二阶矩的原理是什么

初始化除了用__init_用过__new__么?
了解过rpc么?

给定一个数组,求连续子序列乘积为完全平方数的最大长度

判断给定序列是否为二叉搜索树的前序遍历

LightGBM的直方图排序后会比xgboost的效果差吗,为什么

比较两个样本分布均值的差异,t检验,具体哪些指标(

A/B test的实验时长设计,在统计中如果选择实验时长

2. 给一个01二项分布的随机器,参数为p,用它设计一个0-1的均匀分布的随机器(连续的)

如何提升LR的模型性能?

L1有什么缺点?

推荐算法 :
fm
在做特征工程时采用了哪些方法呢? 常见的筛选特征的方法有哪些?
xgb和lgb的区别?他们的应用场景有哪些呢?
问我auc计算并写出来。
auc介绍一下,给出计算公式
xgb怎么并行运算(除了自带的并行找特征分裂点,还说了一般模型的按数据和按特征并行)
进程线程的区别?进程和线程相比有什么好处?

用户态和内核态

逻辑回归 为啥要做特征离散化




XXXXXX公司:
在小样本上,字粒度ner和词粒度ner谁的效果好,然后 用更加细粒度的ner,比如声母 韵母好处是什么
python set底层实现。
10个词 用50维的向量表示合不合适,数据大小足够
大数据读文件,建立堆,直接读文件一部分是不是可以,读大文件的过程。

二面:
lru实现

三面:
新词发现
协同过滤做法
电商场景下,有一些商品的描述(都是词 描述),怎么打tag(无tag体系)



XX公司:
一面:
(语义匹配中)为什么线上用表示模型。
做题:dp 矩阵中的路径数量,左上到右下

二面:
色情检测怎么做,无数据
考察场景题
做题:快排  归并改了下:[ 2 1 3 5 4 ] 左边的数小于当前数的个数  求总和


XX公司:
xlnet中怎么做的attention
crf的loss具体过程
pmi计算
tfidf公式, 演变到bm25公式
bert处理超过512长度的句子



大杂烩:
XX公司: auc计算方法
XXX公司:单调栈、严格递增子序列,不用dp,时间复杂度nlogn 做法、 模型蒸馏、压缩
XX公司:const指针  python lambda表达式求偶数,hadoop spark 学习
XX公司: sigmoid优点为什么用在最后一层、
XXX公司:lru、 cf协同过滤做法、新词发现、电商场景 一堆词 描述  下打tag的过程(tag体系的构建)
XX公司: const 用法  虚函数
XX公司:不同概率的硬币,获得等概率事件
XXXX公司: 给定3n个整数,和为4A,是否存在集合的和分别为A,A,2A的情况
XX公司:二叉树非递归遍历
XX公司:二叉树之字形遍历
XXXX公司:稀疏矩阵乘法(直接乘了加上去)、多卡训练时候norm怎么做、nn.module 和nn.function区别、dataloader和datasampler区别
XX公司        三数之和变种,所有不重复数字的下表组合、transformer-xl其他
XXXX公司       lc原题:011234 找1开始、结束的位置、  fm时间复杂度的优化计算
XX公司       python 如何实现switch





#算法工程师##校招#
全部评论
厉害了!很有用
点赞 回复 分享
发布于 2020-09-09 23:52
固定长度(3,4,5)的青蛙过河[1 4 5 7 10]  [1 6 7 10] 什么意思呢?
点赞 回复 分享
发布于 2020-09-12 15:05
市场怎样 竞争激烈?
点赞 回复 分享
发布于 2020-09-12 15:05
lz能说一下哪个是新加坡的公司吗😂
点赞 回复 分享
发布于 2020-12-29 22:31

相关推荐

4 37 评论
分享
牛客网
牛客企业服务