数据开发-社招面经-某小厂

一面是HR,数仓方面负责人一起面试的,总40Min

1.自我介绍,反问目前公司项目组和部门人数,自己负责哪些工作

2.FineBI使用的一些规范和底层调优(我第一次听说BI底层的优化)

3.Mysql的innodb底层用的B+树,说一下为什么用的B+树

4.Hive在数仓中的作用是什么?(没get到,面试官说是:SQL到MR的转换,HDFS存储到表结构的转换)

5.CDH使用过吗?集群搭建的过程?

6.在工作过程中有遇到过什么困难的问题吗?是怎么解决的?

7.Java开发的一些八股,Mybatis配置如何配置表的?(面试官说进来还要做一些接口和页面的开发)

8.有遇到数据倾斜问题吗?怎么解决的?

9.Yarn的资源调度模式?三种资源调度器有了解吗?

10.简单讲一下目前公司的数仓架构和集群配置,数据量大小(每天增量和全量的大小)

11.刚提到Doris的容灾了,简单讲一下对于容灾的理解

12.了解金蝶ERP的业务系统吗?

13.数仓底层数据存储副本有了解过吗?目前公司是怎么配置的

14.HDFS压缩算法有了解过吧?简单挑两个说一下?

15.还有一些杂七杂八的记不清了

算法:Leetcode 第三题原题,用滑动窗口+Hash表秒了

HR:

1.目前想要从公司离职的想法?

2.最看重公司哪方面?

3.最快到岗时间?

反问:

1.目前公司数仓架构

2.目前数据体系大小

3.进去之后做什么内容

#0offer是寒冬太冷还是我太菜##牛客解忧铺##0offer互助地##投递几十家公司,到现在0offer,大家都一样吗##牛客创作赏金赛#
全部评论
大概40min左右...
点赞 回复 分享
发布于 03-25 16:45 广东

相关推荐

二面是要求线下面试,这也是我第一次线下,没啥经验,提前半小时到的,填了张面试信息表大概用了十分钟,之后等到两点左右,面试官准时来了。#牛客AI配图神器#首先是个人介绍,学校、专业、项目、竞赛。看你是26届的,为什么这么早就开始实习,学校还有课吗?既然学的是软件工程,偏向后端开发,为什么要报数仓开发,你觉得一个后端开发的来数仓开发有什么优势?看你既会Java又会Python,这些语言跟数仓开发之间的联系?之后直接挑明了问简历上俩项目就是网上找的用来练手的吧,那么这种练手项目让你从中学到了什么?说一下用过的数据库有哪些,其中哪些是最熟悉的?(MySQL、Redis)你写SQL写得很多吗,你个人更偏向数仓开发还是数据分析?说一下数据治理的概念。(这个问题是全程唯一一个答偏了的,因为这个词接触得太少了,我硬着头皮把数据分析的概念说了一遍,面试官只是笑笑,没多说话,后边结束了问了学哥才知道概念解释错了)看你数仓都是用了五层规划,每层的作用是什么?你说ODS层的数据是不变的,那后续每日更新的数据是怎么获取的?(Maxwell主从复制,增量同步)如果其它层的数据需要进行更新,该怎么办?(周期快照事实表、拉链表)既然提到拉链表了,说一下它是怎么使用的?(我把拉链表的概念说了一遍)你刚才说的是拉链表的概念,如果现在有a表和b表,其中a表是拉链表,b表数据改变,怎么让a表的数据进行更新?请你看一下这个sql语句,说一下它最后取出来的数值的意义。(那是一个写得极其冗余的sql语句,嵌套了好多层,还join了四次同一张表,我最后没表达清楚,说这个语句是为了得到朝阳区最新的日期的数据,面试官说答得有些不对,其实是为了得到朝阳区最新的日期的空气质量。其实我就是这个意思,当时已经面了30分钟,嘴里开始发苦了,脑子想出来了嘴上没说好)实习最久能待几个月?(12个月)反问咱们公司的业务主要是哪些方面的?每天几点下班?你们的数仓团队现在有多少人?需要出差吗?后续流程需要多久,还会有三面吗?最后跟面试官说聊得很开心。出来后才想起来了没谈薪资的事情,虽然初筛的时候HR问过,但是还是有些后怕啊,不再跟我确认一遍吗写面经攒人品,希望能一把过#数仓面试##数据开发##数仓开发#
查看15道真题和解析
点赞 评论 收藏
分享
评论
点赞
4
分享

创作者周榜

更多
牛客网
牛客企业服务