建信金科-数据分析面试总结

笔试一道算法一道sql40分,20道选择60分
选择:python字符串和指针,java,c++;简单概率论、特征向量
算法:c++递归,算一颗树的得分(左右子树得分+该节点两条边新增的得分=该子树的得分)
sql:求每个department中到岗时间最早的员工(用子查询先计算每个department最早的时间,然后拿员工信息和它比对)

2022.12.1一面,有四位老师:
三范式的定义:答:原子性,依赖主键,去掉非主键之间的函数依赖,去掉主键之间的函数依赖
mysql有哪些删除表的方式,有什么区别
logistic损失函数是什么:交叉熵(没答上来,答了个MSE。。)
kmeans k怎么选,优化?:我只答了grid search可以先挑远一些的k,然后确定最优k大致在什么范围。实际上有kmeans++算法(在初始化k个中心时,先随机选n个,然后之后离这n个中心远的点有更高概率被选为新的中心)、ISODATA(当属于某个类别的样本数过少时把这个类别去除,当属于某个类别的样本数过多、分散程度较大时把这个类别分为两个子类别)、Kernel K-means(核函数核技巧,类似于SVM,映射到高维空间后在进行聚类)
时间序列一般可以分解为哪些因子:趋势,周期,季节,节日,周末
python [1,2,3]*2=?:[1,2,3,1,2,3]。如果想要得到[2,4,6],怎么做?答:1.numpy 2. [2*i for i in [1.2.3]]

二面2022.12.7,高级技术专家的感觉:
DL:
RNN:模型大致流程,gru门的细节,更新门重置门
CNN:模型大致流程(input、卷积、池化、全连接),卷积核的作用,(m,k,s,p)求输出神经元个数
bert:怎么encode
ML:
聚类:kmeans:k怎么选(不需要kmeans++),怎么衡量聚类结果(聚类距离)
SVM:损失函数:hinge loss
python:
tuple/list可以作为key吗?作为key需要有什么条件?:list、dict、set以及带有这三者的tuple不可以,其余的都行;1. 不重复 2. hashable


#建信金科面试##数据分析面经#
全部评论
数分竟然问这么多算法的问题嘛
8 回复 分享
发布于 2022-12-07 15:32 上海
12.1一面的,没后续是不是挂了…我看官网上是一面进行中…
2 回复 分享
发布于 2022-12-08 05:14 江苏
会根据简历来问,你可以引导面试官
1 回复 分享
发布于 2022-12-07 21:40 香港
寄是收到拒信的意思吗
点赞 回复 分享
发布于 2022-12-07 20:46 上海
今天刚面完,但是表现的很不好,大脑宕机了救命🆘内心感觉已经寄了
点赞 回复 分享
发布于 2022-12-07 21:41 香港
老哥有没有说多久出面试结果啊,我们二面面试的群没解散说会给个预通知
点赞 回复 分享
发布于 2022-12-08 20:48 甘肃
请问面试没问之前实习经历或项目嘛 还是基本就是八股题了
点赞 回复 分享
发布于 2023-04-16 00:43 上海
你好,算法只能用c++吗?可以用python吗?
点赞 回复 分享
发布于 2023-05-08 15:04 江苏
怎么问了这么多算法
点赞 回复 分享
发布于 2024-02-26 16:19 广东

相关推荐

2024.12.23(一面)一面 (1h 5mins)- 实习拷打  - 快手-评论模版留存率(10 mins)    - 严格漏斗和非严格漏斗的区别  - 字节-链路改造优化    - 延伸:数据的时效性怎么保证(从整体和单点分别叙述)    - 延伸:优化任务的思路    - 延伸:并行度相关的改法(三种)    - repartition()能改变第一个stage的shuffle write的并行度吗?    - 第一个stage的shuffle write的并行度由什么决定?  - 字节怎么分的数据域  - 字节分了哪些主题域  - 数据域和主题域的区别(主题域:自上向下,从分析的角度划分)  - 分层的意义(复用性和一致性)  - 怎么考虑分层,该分多少层(直接说了没必要在意这个,要理解分层的本质,面试官表明说的也有道理,也抛了另一个观点:肯定要分层,需要有不同粒度的数据,每个人在意数据都不同,比如说老板在意汇总层的数据,数分可能更在意明细层的数据,另外,在做归因分析的时候也需要血缘追踪)- SQL题二面 (26 mins)全程实习拷打- 自我介绍- 字节实习  - 多机房代码一致性怎么保证的(治理存量,增量通过oceanus)  - 多机房涉及到的网络问题(通过全球化数据迁移解决)- 快手实习  - 评论模版留存率    - 严格漏斗和非严格漏斗的区别(准确性和计算量之间的取舍)    - 为什么这样设计    - 最终的目的是什么    - 有没有想过通过抽样解决数据量大的问题- 反问
查看18道真题和解析
点赞 评论 收藏
分享
评论
11
67
分享

创作者周榜

更多
牛客网
牛客企业服务