大哥可以私一下总包薪资吗,感谢!
点赞 评论

相关推荐

一面:- 飞书,没开摄像头## 项目- 重点了解一下这个离线数仓项目,你可以展开说一下吗?  - 背景,意义,人员组成,整个数据流动过程,我的职责- 你这边主要做的工作内容可以展开讲讲一下吗?  - 我这边主要的工作内容就是针对这个xx主题的两个指标进行拆解和计算。- 它是怎么计算的,可以说明一下吗?  - 我理解其实这两个指标应该都还是有一个**时间维度**  - 你们时间维度又具体是怎么设计的?是天还是周还是月,各种还是各种都有。- 那你这边再具体做了一些数据开发的工作,你可以说一下吗?就比如说你做了哪些表,以及是什么来支撑这个指标的计算的。  - **DWS表的粒度到底是用户粒度还是用户登录行为粒度?**- 就是你自己写Spark或者你自己研究Spark这里面,比如说你有没有遇到过一些比较难的问题,以及是怎么解决。  - 数据倾斜问题  - **那你就这个优化前后它的一个对比的指标是什么样。那它运行速度有变化吗?**场景sql题:- 假设我有一兆的一张表,那学生的成绩表,他有学生ID课程ID以及分数。然后我想计算每一门课程分数前三的学生,把这样的一个信息给拿出来。怎么做呢?  - rank() over(partition by c_id order by score)---二面:- 飞书,开摄像头## 项目- 介绍项目场景、全流程、个人职责- 最终产生的业务价值是什么呢?- 数据出来之后,会你的使用方是谁呢?就是会谁来用这份数据来做什么事- 实时这边有接触吗?  - flink的基本的原理有看过吗?就比如说为什么flink它它适合做什么样的事情,它能解决什么问题?  - 他这里背后的整个技术链会有哪些呢?就是比如说实时数据处理里面- Spark这个task stage和job他们是什么关系?  - 我们可以调整它的task的个数吗?- SparkSQL写得多吗- HiveSQL和SparkSQL逻辑上有什么不一样的?- 成长的规划,你大概是怎么设想的?技术上的- 像那个其实因为现在你接触实时的比较少,那后面在业务上如果有有的有这个诉求对吧?然后你准备怎么弥补这些短板?  - 比如说我们既有工作任务,又要学习你这个你觉得自己的抗压的能力够吗?
查看22道真题和解析
点赞 评论 收藏
分享
二面是要求线下面试,这也是我第一次线下,没啥经验,提前半小时到的,填了张面试信息表大概用了十分钟,之后等到两点左右,面试官准时来了。#牛客AI配图神器#首先是个人介绍,学校、专业、项目、竞赛。看你是26届的,为什么这么早就开始实习,学校还有课吗?既然学的是软件工程,偏向后端开发,为什么要报数仓开发,你觉得一个后端开发的来数仓开发有什么优势?看你既会Java又会Python,这些语言跟数仓开发之间的联系?之后直接挑明了问简历上俩项目就是网上找的用来练手的吧,那么这种练手项目让你从中学到了什么?说一下用过的数据库有哪些,其中哪些是最熟悉的?(MySQL、Redis)你写SQL写得很多吗,你个人更偏向数仓开发还是数据分析?说一下数据治理的概念。(这个问题是全程唯一一个答偏了的,因为这个词接触得太少了,我硬着头皮把数据分析的概念说了一遍,面试官只是笑笑,没多说话,后边结束了问了学哥才知道概念解释错了)看你数仓都是用了五层规划,每层的作用是什么?你说ODS层的数据是不变的,那后续每日更新的数据是怎么获取的?(Maxwell主从复制,增量同步)如果其它层的数据需要进行更新,该怎么办?(周期快照事实表、拉链表)既然提到拉链表了,说一下它是怎么使用的?(我把拉链表的概念说了一遍)你刚才说的是拉链表的概念,如果现在有a表和b表,其中a表是拉链表,b表数据改变,怎么让a表的数据进行更新?请你看一下这个sql语句,说一下它最后取出来的数值的意义。(那是一个写得极其冗余的sql语句,嵌套了好多层,还join了四次同一张表,我最后没表达清楚,说这个语句是为了得到朝阳区最新的日期的数据,面试官说答得有些不对,其实是为了得到朝阳区最新的日期的空气质量。其实我就是这个意思,当时已经面了30分钟,嘴里开始发苦了,脑子想出来了嘴上没说好)实习最久能待几个月?(12个月)反问咱们公司的业务主要是哪些方面的?每天几点下班?你们的数仓团队现在有多少人?需要出差吗?后续流程需要多久,还会有三面吗?最后跟面试官说聊得很开心。出来后才想起来了没谈薪资的事情,虽然初筛的时候HR问过,但是还是有些后怕啊,不再跟我确认一遍吗写面经攒人品,希望能一把过#数仓面试##数据开发##数仓开发#
查看15道真题和解析
点赞 评论 收藏
分享
牛客网
牛客企业服务