数据分析/数据建模面经


数据相关:

项目中不平衡数据如何处理

项目中数据量的大小

项目中数据的特征介绍

什么是hard样本什么是easy样本

机器学习相关:

Boosting bagging的区别

决策树的分裂的计算(ID3, C4.5,CART

Adaboost GBDT 的区别

Adaboost GBDT的损失函数

Xgboost GBDT的区别

Boosting Random Forest Tree 的区别

梯度下降和随机梯度下降的区别

逻辑回归,svm和树模型的区别

项目中为什么选择GBDT而不是adaboost

采用什么作为模型好坏的评判标准(accuracy, f1-macro

降维的方法

树模型如何调参

如何检测模型是否过拟合

如何减少过拟合现象的产生

深度学习相关:

Attention self attention的区别

介绍一下Transformer

Bert提升了transformer的哪些东西

BERTRNN好在哪里

RNN, LSTM, BERT的优缺点

梯度消失和梯度爆炸产生的原因

如何解决梯度消失和梯度爆炸

介绍一下推荐系统的算法(协同过滤,基于内容的推荐)

插一句,杭州除了大厂以外,中小厂很少很少有做数据分析的。 大厂数分没个985本硕或者同级别海外院校基本没戏,中小厂数据岗位吃经验基本不招应届生。建议,想找数分的不要来杭州! 

#春招##面经##数据分析师#
全部评论
杭州中小厂的数据分析大部分是数据运营,用excel拉表格,数据库都没有
1 回复 分享
发布于 2022-04-02 10:03
好家伙,数分都要问Bert了吗
点赞 回复 分享
发布于 2022-04-05 21:29
请问是哪家公司呀
点赞 回复 分享
发布于 2022-05-31 21:36

相关推荐

自我介绍Redis + Token 确保幂等性? 过期怎么处理线程池+ CompletableFuture 进行异步任务编排是怎么去搭配使用的线程池7大参数什么场景下用到核心线程数, 什么场景下用到最大线程数 如果超出最大线程数会怎么样(拒绝策略)结合线程池优化处理过程。接口响应速度提升40%这个提升怎么计算的除了线程池外, 还知道其他的线程安全的类吗对你简单说一下的锁升级的过程在偏向锁这个状态的时候, 它的hash值怎么存储的可见性和有序性是怎么实现的AQS原理简单说一下i++操作的时候是怎么保证原子性的CAS操作是怎么保证原子性的单例模式为什么会用到Volatile类的一个加载过程双亲委派模型简单说一下你知道的年轻代和老年代用到的垃圾回收器G1和ZGC的区别如果让你做JVM调优你该从哪些方面入手如果有大对象回收不了该怎么分析两个线程如何交替打印字符和数字wait 和notify如果要用AQS的子类实现呢?Semaphore和ConditionTCP/IP协议3次握手4次挥手的过程发送数据该怎么知道我从哪里开始发送数据, 他这个序列号是怎么产生的Mysql的MVCC里面undolog作用是什么 快照读和当前读 怎么和他们配合的谈谈对Spring的理解怎么实现对一个接口前后的日志记录Spring Boot自动装配原理循环依赖是怎么解决的其实二级缓存就可以解决了, 为什么要用三级缓存快排插入排序
查看37道真题和解析
点赞 评论 收藏
分享
不愿透露姓名的神秘牛友
11-04 21:53
已编辑
点赞 评论 收藏
分享
15 106 评论
分享
牛客网
牛客企业服务