猿辅导——大数据平台面经(凉经)

二面
1、为什么用seatunnel进行同步,不用dataX?
2、seatunnel底层引擎是spark,那为什么不直接用原生的spark进行同步呢?
3、项目有什么做的不够好的?
ODPS相当于hive,多进程写入会产生表锁,没法利用spark的并发优势——1.统一管理ODPS表,每个分区写入一张表,读取的时候直接读取表,然后每天定时进行聚合。这个过程对于用户来说是无感的。2.分布式锁,阻塞的多进程写入
对于分区不太友好,分区字段必须要全部写全,不能只填一个
4、介绍一下spark shuffle
5、spark shuffle一定会写文件吗
没答好,考虑大小的同时需要去考虑GC,shuffle属于中间计算结果,
算法:股票问题,字符串数组差集

三面
1、自我介绍
2、深挖实习项目细节
3、怎么对一个接口做测试呢?从什么角度入手?
4、你刚才说的是引擎侧的,如果是针对系统呢?接口测试你觉得考虑哪几个指标?
5、局域网之间,互相ping的延迟是什么?
6、单机情况下,以硬件和资源角度出发,如果去提高系统的性能?
7、hdfs架构
8、HA?journalNode?
9、理想的行业以及方向
10、对公司氛围有什么期待
11、反问

挂了...确实不太会测试
#猿辅导##大数据##面经#
全部评论
lz什么时候三面的呀?
点赞 回复 分享
发布于 2022-10-10 23:38 北京
直接就感谢信了吗,还是还在池子排序
点赞 回复 分享
发布于 2022-10-11 10:34 浙江
兄弟用的seatunnel的v1还是v2
点赞 回复 分享
发布于 2023-02-26 22:49 陕西

相关推荐

昨天 12:37
已编辑
门头沟学院 Unity3D客户端
如题,鼠鼠快碎掉了。鼠鼠正在投暑期和日常的实习,可能是因为简历太差吧,好多初筛都没有过,所以其实格外珍惜每一次的约面。尤其鼠鼠是八股选手,但凡碰到喜欢问项目的面试官是直接速通鼠掉。那是一个万里无云的晚上,鼠鼠接到tx某子公司的约面,虽然没算法题但是问得我汗流浃背,面试官从我的八股批判到我的项目继而批判到我的实习,感觉基本上除了八股这种特定答案之外每一个问题都要质问我,尤其是询问到实习的时候我解释完之后直接来了一句“那你实习也啥也没做啊”,鼠鼠直接原地碎掉。之后的问题鼠鼠也不太记得了,大部分都是直接吟诵咒语,肌肉记忆直接不过脑子。因为接二连三的压力鼠鼠直接摆烂了,回答的时候也不太看屏幕直接开始搓...
机器人为什么是猫呀:楼主要自信。好的面试官是会照顾面试者情绪的,不会直接说那么伤人的话。面试表现其实很看自己的心态跟情绪,这些又和面试官的反馈很相关。而且有些面试官很高傲,不求甚解,自认为你的东西看一眼很简单,就不会听你说了,却没有从一个没有丰富工作经验的人的角度去思考。楼主不要因为这些影响心态,不要怀疑自己,只要遇到一个“合适”的面试官就会好很多的。
点赞 评论 收藏
分享
评论
4
10
分享

创作者周榜

更多
牛客网
牛客企业服务