笔试一道算法一道sql40分,20道选择60分选择:python字符串和指针,java,c++;简单概率论、特征向量算法:c++递归,算一颗树的得分(左右子树得分+该节点两条边新增的得分=该子树的得分)sql:求每个department中到岗时间最早的员工(用子查询先计算每个department最早的时间,然后拿员工信息和它比对)2022.12.1一面,有四位老师:三范式的定义:答:原子性,依赖主键,去掉非主键之间的函数依赖,去掉主键之间的函数依赖mysql有哪些删除表的方式,有什么区别logistic损失函数是什么:交叉熵(没答上来,答了个MSE。。)kmeans k怎么选,优化?:我只答了grid search可以先挑远一些的k,然后确定最优k大致在什么范围。实际上有kmeans++算法(在初始化k个中心时,先随机选n个,然后之后离这n个中心远的点有更高概率被选为新的中心)、ISODATA(当属于某个类别的样本数过少时把这个类别去除,当属于某个类别的样本数过多、分散程度较大时把这个类别分为两个子类别)、Kernel K-means(核函数核技巧,类似于SVM,映射到高维空间后在进行聚类)时间序列一般可以分解为哪些因子:趋势,周期,季节,节日,周末python [1,2,3]*2=?:[1,2,3,1,2,3]。如果想要得到[2,4,6],怎么做?答:1.numpy 2. [2*i for i in [1.2.3]]二面2022.12.7,高级技术专家的感觉:DL:RNN:模型大致流程,gru门的细节,更新门重置门CNN:模型大致流程(input、卷积、池化、全连接),卷积核的作用,(m,k,s,p)求输出神经元个数bert:怎么encodeML:聚类:kmeans:k怎么选(不需要kmeans++),怎么衡量聚类结果(聚类距离)SVM:损失函数:hinge losspython:tuple/list可以作为key吗?作为key需要有什么条件?:list、dict、set以及带有这三者的tuple不可以,其余的都行;1. 不重复 2. hashable寄#建信金科面试##数据分析面经#