收获满满的一次好未来大数据开发面试(已意向)

希望能够对学大数据开发的同学有帮助,少走弯路!

一面
老刘在一面遇到了大佬,他是从事数据仓库开发,有着很多年的经验,老刘的项目是一个特别简单的数据仓库项目,为什么会有这个数据仓库项目?原因也特别简单,就是想让简历上的内容多一点,就根据某培训机构的资料,按照自己的理解对它进行了一些更改和创新,但它依然是一个特别low项目。
大佬先让我讲了讲数据仓库的项目流程,然后开始了下面这段对话:
  1. 如何保证数据一致性或者说维度一致性
  2. 如何保证数据质量
  3. 总线矩阵
  4. 维度建模和关系建模一些知识(这个我知道)
  5. 数据如何治理,元数据数仓怎么做之类的
老刘听到上面的内容,立马头大了,我只是做了一个特别简单的数仓项目,没想到面试官从这么专业的角度来问我,我心里想我只是一个应届生,哪有数仓经验啊,我就网上随便找了一个,它里面也没说到这些啊!
(这里想说的是我数据开发框架的部分答得挺好的)
面试官最后也没为难我,然后大致给我讲了讲如何从企业的角度构建数据仓库,它远远不是我这种数仓级别,我真的在这场面试中收获了很多东西,具体如何从企业角度构建数据仓库,我推荐大家看看看那本书叫《阿里巴巴大数据实践》
老刘也是太大意了,从来也没想到我的数仓小项目会反复问来问去,也希望大家能够对自己的项目有更深层次的理解

二面
问了三个问题
  1. 给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url? 这个就是分小文件了

  2. 每个数在[-100,100]之间,给定100万个数,请按从大到小的顺序输出他们?我想的是用hashmap

  3. “A(id) values(1,1), B(id) values(1)" select a.id as aid,b.id as bid from a join b on a.id = b.id

    返回结果是什么,替换为left join 或right join呢?
最后问了问ZooKeeper选举的全新选举和非全新选举以及ZAB协议

HR面
这就是网上都能搜到的内容了,如下:
  1. 你的专业和大数据开发不一样,你为什么要做大数据开发(我心里想我愿意学啥就学啥)
  2. 你怎么学大数据开发的?
  3. 你的优缺点?
在8月19号收到了意向书,我其实感觉一面应该挂了,但面试官给机会了,也挺感激他的!
#好未来##面经##大数据开发工程师##校招#
全部评论
老刘
点赞 回复 分享
发布于 2021-08-23 23:49
每个数在[-100,100]之间,给定100万个数,请按从大到小的顺序输出他们? 这道题怎么做的呢? 还有老哥,算法题手撕了吗
点赞 回复 分享
发布于 2021-08-26 21:58
老哥问下有没有问到hadoop组件和hive.调优一些东西啊
点赞 回复 分享
发布于 2021-08-28 11:42
大数据开发Flink面试必备知识点汇总:https://mp.weixin.qq.com/s/z7ARcN2k7ZzAKABJ0pZxTQ
点赞 回复 分享
发布于 2021-08-28 15:53

相关推荐

科大讯飞 nlp算法工程师 n+4
点赞 评论 收藏
分享
传音控股 软件开发方向 总包n,公积金7%
点赞 评论 收藏
分享
忘了什么时候投的 hr打电话约面自我介绍线程进程协程区别 ✅协程的底层 ✅什么时候会用到协程和多线程 ✅❌ 说了资源加载的时候 面试官指出协程还是在unity主线程运行的 如果资源加载时间过长依然会卡顿 并补上了在进行网络连接的时候单独开一个线程dfs bfs区别 ✅状态同步和帧同步✅lua ipairs 和 pairs的区别✅canvas 三种渲染方式✅介绍一下在凉屋的工作内容✅animator的layer什么作用 什么时候用?✅怎么做多分辨率下的ui适配✅已经有了这个gameobject 如何判断这个ui界面是否显示✅❌https (说不会然后不问了)❌有一块半圆形的滑道 一个人物带着滑板去滑雪 怎么实现让这个滑板时刻贴紧滑道❌开始做题 判断链表是否有环  1分钟解决看太快了直接上 正则表达式匹配 写dp不让 然后写了暴力递归 也不满意提示说有双指针做法 不会然后换题括号匹配 秒了 比较好笑的是出题系统bug了 答案就在上面 并且题目描述是括号生成 不过我没看 写完面试官笑了反问介绍完业务之后问我用没用过什么ai工具 面试官举了几个 纯聊天 面试官人感觉很不错 Update  刚刚收到hr电话说过了 直接offer 已拒
查看36道真题和解析
点赞 评论 收藏
分享
评论
7
51
分享

创作者周榜

更多
牛客网
牛客企业服务