数据分析面经-问答③

一定一定会有简历项目深挖,面试前仔细从头回顾一遍自己做的项目,你的思路、实现、遇到的问题、如何解决,绝对不要让面试官觉得你项目就是复制黏贴,自己啥也不会的

能接受的工作强度

根据自己心里预期来,可以接受加班但是要合理,必要性工作以及加班补贴

和老板意见不合怎么办

先吹老板,说老板的战略眼光肯定远,他的想法是有道理的,和老板沟通交流想法

然后说自己,老板的意见要求是否不符合实际、实现难度大等,业务细节老板是不是不清楚等

最后就是老板意见作为参考,自己根据具体进行分析,出了分析结果再和老板协调(记住你是数据分析师,老板是要你给意见的)

举例pandas中的常见函数(GPT回答仅供参考)

pd.read_csv(): 从 CSV 文件中读取数据并创建 DataFrame

df.head()df.tail(): 分别显示 DataFrame 的前几行和后几行数据

df.info(): 显示 DataFrame 的基本信息,包括列名、非空值数量、数据类型等

df.describe(): 显示数值型列的统计信息,包括均值、标准差、最小值、最大值等

df['column_name']: 选择指定列的数据

df.dropna(): 删除包含缺失值的行或列

df.fillna(value): 将缺失值填充为指定的值

df.sort_values(): 根据指定列的值对 DataFrame 进行排序

df.groupby(): 按照指定的列进行分组,并进行聚合操作

pd.concat()pd.merge(): 合并多个 DataFrame

df.to_csv()df.to_excel(): 将 DataFrame 中的数据导出到 CSV 文件或 Excel 文件

df.transpose():实现行列转化

怎样实现聚合

使用 groupby() 方法按照一个或多个列名对数据进行分组

可以使用聚合函数对分组后的数据进行统计、计算等操作。常见的聚合函数包括 sum()mean()max()min()

分组后reset_index() 是为了重新设置索引,将分组的列变为普通列

还可以自定义聚合函数

使用.agg() 方法应用聚合函数【.apply() 可以用于任意函数的应用,可以是聚合函数也可以是自定义函数,适用于对整个 DataFrame 或 Series 进行逐元素操作】

了解数据埋点吗?(看jd有没有这方面要求,有的话需要准备)

总部给你下发作业之后,下面的人觉得没有用,该怎么处理

先和团队成员沟通,了解原因,听取意见

共同分析作业的目的和意义,明白作业的重要性,如果和实际业务无关向总部反馈

提供支持和帮助,给与激励和认可

如何实现随机hash分桶(GPT回答仅供参考)

你认为数据分析师有什么重要的特点,你怎样匹配

分析思维,掌握了分析技能和分析方法,懂得多方向思考,维度下钻,反向思考,指标拆分

数据敏感度,能够理解数据的关键趋势和一场

分析工具,包括数据分析和可视化工具,如python、SQL、BI工具

跨部门沟通,需要和多个部门对接,个人有过承办赛事和其他部门对接的经历,充当团队项目中和组员、指导老师的沟通桥梁

持续学习,一直在学,目前先学习业务基础,再丰富知识框架和体系

为啥没有实习经验?

大一大二没明确感兴趣的方向,大三碰到好老师就对数据分析有了兴趣,但是当时还在犹豫是考研还是实习,后面发现自己不太喜欢埋头学习,就打算就业了,后面暑期实习来不及投了,就只能先去学习数分相关的知识了

怎么学数分的?

csdn上先查,发现大多是实战和可视化,没有学习体系,就去了B站找相关up主看视频教程,先把大致学习步骤了解了。后面就去详细学sql了嘛(python一直在用,数据库隔了有点久不太会了),一边练sql一边学数分思维数分方法,学了下excel和BI工具,后面找项目实战的时候了解到数分学习平台kaggle和和鲸,就先跟着做项目

中位数,众数的特点和用途

中位数(找中间) 不受极端值(异常值)影响,在对称分布的数据中与均值接近,但在非对称分布情况下中位数更能反映数据的典型值

用途:通常用来描述数据集的中间值,特别是在数据集中包含异常值或偏斜时更为适用,比如收入、房价等,用来代表典型的个体或家庭所处的经济水平,而不受到极端富裕或贫困家庭的影响

众数(找集中) 数据集中出现频率最高的值,可能有一个众数(单峰分布)或多个众数(多峰分布),直接反映了数据集中最常见的数值

用途:描述数据集的集中趋势,尤其是分类数据或具有明显集中倾向的连续数据时,在市场调研、产品销量分析等领域中,众数可用来识别最受欢迎的选项或最常出现的情况

除了方差分析还有什么统计模型(统计学的同学应该被问得多,我软件工程就学了个概率论应该不会被问吧==)

线性回归,逻辑回归,时间序列,因子分析,聚类分析,贝叶斯网络模型

归因分析有哪些技术(本人不熟悉的范畴,可以简单了解一下)

线性归因,时间序列归因,路径归因,机会归因,因果推断归因

全部评论
我大专学的软件开发方向电子商务专业,学了大学英语,大学语文,高等数学,数据库,web,.net,c#,网页三剑客,国际贸易实务,商务谈判,物流管理,客户关系管理,计算机基础,网络安全,证券投资等课程,我一点也不记得了。好担心挣不到钱。
点赞 回复 分享
发布于 07-19 21:14 江西
大佬,这是一场的面经还是几场的面经呀
点赞 回复 分享
发布于 08-03 00:05 北京
大佬,我想问下数分投简历前需要有哪里知识储备 学哪些课
点赞 回复 分享
发布于 08-23 21:13 广东
boss上简历一发,hr一个电话打过来,还真被问到为什么没实习经验了,答的一坨屎
点赞 回复 分享
发布于 09-11 21:08 浙江

相关推荐

自我介绍Redis + Token 确保幂等性? 过期怎么处理线程池+ CompletableFuture 进行异步任务编排是怎么去搭配使用的线程池7大参数什么场景下用到核心线程数, 什么场景下用到最大线程数 如果超出最大线程数会怎么样(拒绝策略)结合线程池优化处理过程。接口响应速度提升40%这个提升怎么计算的除了线程池外, 还知道其他的线程安全的类吗对你简单说一下的锁升级的过程在偏向锁这个状态的时候, 它的hash值怎么存储的可见性和有序性是怎么实现的AQS原理简单说一下i++操作的时候是怎么保证原子性的CAS操作是怎么保证原子性的单例模式为什么会用到Volatile类的一个加载过程双亲委派模型简单说一下你知道的年轻代和老年代用到的垃圾回收器G1和ZGC的区别如果让你做JVM调优你该从哪些方面入手如果有大对象回收不了该怎么分析两个线程如何交替打印字符和数字wait 和notify如果要用AQS的子类实现呢?Semaphore和ConditionTCP/IP协议3次握手4次挥手的过程发送数据该怎么知道我从哪里开始发送数据, 他这个序列号是怎么产生的Mysql的MVCC里面undolog作用是什么 快照读和当前读 怎么和他们配合的谈谈对Spring的理解怎么实现对一个接口前后的日志记录Spring Boot自动装配原理循环依赖是怎么解决的其实二级缓存就可以解决了, 为什么要用三级缓存快排插入排序
查看37道真题和解析
点赞 评论 收藏
分享
5 58 评论
分享
牛客网
牛客企业服务