数据分析面经-问答③
一定一定会有简历项目深挖,面试前仔细从头回顾一遍自己做的项目,你的思路、实现、遇到的问题、如何解决,绝对不要让面试官觉得你项目就是复制黏贴,自己啥也不会的
能接受的工作强度
根据自己心里预期来,可以接受加班但是要合理,必要性工作以及加班补贴
和老板意见不合怎么办
先吹老板,说老板的战略眼光肯定远,他的想法是有道理的,和老板沟通交流想法
然后说自己,老板的意见要求是否不符合实际、实现难度大等,业务细节老板是不是不清楚等
最后就是老板意见作为参考,自己根据具体进行分析,出了分析结果再和老板协调(记住你是数据分析师,老板是要你给意见的)
举例pandas中的常见函数(GPT回答仅供参考)
pd.read_csv()
: 从 CSV 文件中读取数据并创建 DataFrame
df.head()
, df.tail()
: 分别显示 DataFrame 的前几行和后几行数据
df.info()
: 显示 DataFrame 的基本信息,包括列名、非空值数量、数据类型等
df.describe()
: 显示数值型列的统计信息,包括均值、标准差、最小值、最大值等
df['column_name']
: 选择指定列的数据
df.dropna()
: 删除包含缺失值的行或列
df.fillna(value)
: 将缺失值填充为指定的值
df.sort_values()
: 根据指定列的值对 DataFrame 进行排序
df.groupby()
: 按照指定的列进行分组,并进行聚合操作
pd.concat()
, pd.merge()
: 合并多个 DataFrame
df.to_csv()
, df.to_excel()
: 将 DataFrame 中的数据导出到 CSV 文件或 Excel 文件
df.transpose():实现行列转化
怎样实现聚合
使用 groupby() 方法按照一个或多个列名对数据进行分组
可以使用聚合函数对分组后的数据进行统计、计算等操作。常见的聚合函数包括 sum()
、mean()
、max()
、min()
分组后reset_index() 是为了重新设置索引,将分组的列变为普通列
还可以自定义聚合函数
使用.agg() 方法应用聚合函数【.apply() 可以用于任意函数的应用,可以是聚合函数也可以是自定义函数,适用于对整个 DataFrame 或 Series 进行逐元素操作】
了解数据埋点吗?(看jd有没有这方面要求,有的话需要准备)
总部给你下发作业之后,下面的人觉得没有用,该怎么处理
先和团队成员沟通,了解原因,听取意见
共同分析作业的目的和意义,明白作业的重要性,如果和实际业务无关向总部反馈
提供支持和帮助,给与激励和认可
如何实现随机hash分桶(GPT回答仅供参考)
你认为数据分析师有什么重要的特点,你怎样匹配
分析思维,掌握了分析技能和分析方法,懂得多方向思考,维度下钻,反向思考,指标拆分
数据敏感度,能够理解数据的关键趋势和一场
分析工具,包括数据分析和可视化工具,如python、SQL、BI工具
跨部门沟通,需要和多个部门对接,个人有过承办赛事和其他部门对接的经历,充当团队项目中和组员、指导老师的沟通桥梁
持续学习,一直在学,目前先学习业务基础,再丰富知识框架和体系
为啥没有实习经验?
大一大二没明确感兴趣的方向,大三碰到好老师就对数据分析有了兴趣,但是当时还在犹豫是考研还是实习,后面发现自己不太喜欢埋头学习,就打算就业了,后面暑期实习来不及投了,就只能先去学习数分相关的知识了
怎么学数分的?
csdn上先查,发现大多是实战和可视化,没有学习体系,就去了B站找相关up主看视频教程,先把大致学习步骤了解了。后面就去详细学sql了嘛(python一直在用,数据库隔了有点久不太会了),一边练sql一边学数分思维数分方法,学了下excel和BI工具,后面找项目实战的时候了解到数分学习平台kaggle和和鲸,就先跟着做项目
中位数,众数的特点和用途
中位数(找中间) 不受极端值(异常值)影响,在对称分布的数据中与均值接近,但在非对称分布情况下中位数更能反映数据的典型值
用途:通常用来描述数据集的中间值,特别是在数据集中包含异常值或偏斜时更为适用,比如收入、房价等,用来代表典型的个体或家庭所处的经济水平,而不受到极端富裕或贫困家庭的影响
众数(找集中) 数据集中出现频率最高的值,可能有一个众数(单峰分布)或多个众数(多峰分布),直接反映了数据集中最常见的数值
用途:描述数据集的集中趋势,尤其是分类数据或具有明显集中倾向的连续数据时,在市场调研、产品销量分析等领域中,众数可用来识别最受欢迎的选项或最常出现的情况
除了方差分析还有什么统计模型(统计学的同学应该被问得多,我软件工程就学了个概率论应该不会被问吧==)
线性回归,逻辑回归,时间序列,因子分析,聚类分析,贝叶斯网络模型
归因分析有哪些技术(本人不熟悉的范畴,可以简单了解一下)
线性归因,时间序列归因,路径归因,机会归因,因果推断归因