2022秋招蚂蚁金服二面
蚂蚁金服面试
一、一分钟自我介绍。
二、简历相关问题。
1、实习中主要做的事情,从三方面来回答,工作内容、为谁工作、主要指标。
对这部分人做了什么?
结果:提升转化率、留存。
2、ABtest的流程、原理、参数设置、主要关注的统计效果。
分享了一个AB测试的项目
3、我用到的主要工具、语言?
分两块。一是hive sql用来取数;二是python、excel,用来数据可视化。
4、sql问题
4.1 数据库底层知识:主键是什么?
主键是指,表中经常有一个列或者多列的组合,其值能够唯一地标识表中的每一行。ton过他可以强制表的实体完整性。当创建或者更改表时可以通过定义PRIMARY KEY约束来创建主键。一个表只能有一个PRIMARY KEY来约束,而且不接受空值。
特征:1)唯一性,2)非空,3)用于其他表的外键关联。
4.2 窗口函数了解吗?举例。
-
静态窗口函数:用于排序,row_number,rank,dense_rank
-
滑动窗口函数:
-
聚合函数:累计求和sum(),求平均avg(),percent_rank累计百分比,cume_dist累计分布
-
取值函数:lead,lag,first_value,last_value,nth_value,ntile
-
参考链接:窗口函数
4.3 Null和empty的区别。
null:空值。is null、is not null
empty: =“”
可以用ifnull 来判断。
-
SQL语句中对空字符串进行判断时可以使用=、>、<符号;但是对NULL进行判断时必须使用is null或is not null。
-
使用count()函数进行统计时,会过滤掉NULL值,但不会过滤掉空字符串。
4.4hive sql和sql的区别
总体一致,hiveSQL的设计目的是让会SQL不会编程MapReduce的也能使用Hadoop进行数据处理
-
hive 不支持等值连接
-
hive对分号不敏感
-
hive中string类型的字段为empty时,对他进行isnull的判断等于FALSE
-
hive不支持将数据插入现有的表或分区中,仅支持覆盖重写整个表。 支持 insert overwrite
-
hive 不支持 insert into 表 values(),update、delete操作
-
hive支持嵌入MapReduce程序,来处理复杂的逻辑
-
hive支持将转换后的数据直接写入不同的表、分区、hdfs、本地目录
参考链接:hive SQL 和SQL
5、python相关的问题
5.1 常用的模块。
分三块。一是excel数据处理相关的,numpy、pandas;二是数据可视化相关的,matplotlib、seaborn;三是机器学习相关的,scikit-learn。
参开链接:https://www.cnblogs.com/mo-wang/p/4759467.html
5.2 数据处理的问题:日期的处理,怎么把date转化成int格式?
datetime 中strptime:string转datetime
strftime:datetime转string
参考链接:https://blog.csdn.net/yuchenwuhen/article/details/51103543
6、想做商业数据分析师还是数据科学家?
答:商业数据分析师。
1、兴趣
2、经验
3、能力
7、异常分析。日活上涨20%,分析原因?
三、反问
1、主要负责什么内容?
2、校招数据分析师需要具备的能力和素质?
1)技术能力。SQL、机器学习。
2)业务能力。business sense。做商业数据分析师,更重要的是对业务的理解能力。
四、其他
面试官好心帮我看了一下流程,说会有很多轮,他也不知道下一轮是谁,等待安排,他只能看见前面一轮的时间在9.16。
我的感受:
问的东西广,但是不深。
阿里果然有很多很多轮。加油,每一轮都要好好表现啊。
结果: