还有同学吗组里hc挺多的_牛客网

牛客916304435号

2024-12-09 14:51 北京现代音乐研修学院大数据开发工程师

关注

还有同学吗组里hc挺多的

点赞评论

03-06 19:13

北京懂车帝科技有限公司_数据开发(实习员工)

腾讯PCG-数据工程一面

1.  简单介绍一下项目2.  在中间层建设中遇到过什么问题3.  数仓中状态的更新是比较及时的,如何记录这些状态,最核心是关心最终的状态还是流转的状态4.  拉链表是什么,怎么实现的,执行过程中怎么解决效率的问题5.  用的什么计算引擎,sql在spark上怎么执行的6.  spark的提交流程7.  uv和pv的含义,计算uv在spark上的运行原理8.  MapReduce的原理,快排的目的是什么,有序的目的是什么,知道每个过程才能知道如何去调优9.  sql转ast是怎么转的10. ast做逻辑执行计划优化做了哪些11. 逻辑执行计划和物理执行计划大概有什么区别12. 写sql过程中有没有遇到过执行时间特别长的,引出数据倾斜相关内容(问的很细,基本所有的都问了)13. 不同数据类型join为什么导致数据倾斜14. mapjoin和正常join的区别,mapjoin原理是什么,怎么实现的15. 加随机数打散,两阶段聚合怎么做的16. new一个线程怎么做,thread和runnable的区别是什么17. java集合类用过哪些(说没怎么用过java,就没再问了)18. sql在不同执行引擎下有什么区别,答有些语法不通用,为什么不通用,如何造成这种问题的19. sql中所有关键字的执行顺序20. a join b where条件写在join里面和join外面 有什么区别21. 4道sql22. 一道mid算法做的是计算引擎调优，一直在问spark底层，顶不住顶不住。当晚挂...

查看20道真题和解析

点赞评论收藏

分享

03-11 22:32

已编辑

华中师范大学大数据开发工程师

字节_数开实习_一面

- 飞书面试间，在飞书上撕代码- 问了很多计算机基础八股，痛击薄弱点## 八股- 讲一讲线程池- Java实现线程的几种方法，有什么区别- 线程池的具体参数- 进程和线程的区别- java中如何控制进程内存- 讲一讲数据库的事务是什么- 讲一讲数据库中的锁有哪些- 讲一讲对索引的理解- 如何存储索引的- B树和B+树存储索引的区别- 相同数据量下，B树和B+树哪一个查询更快- http和https- 讲一讲TCP- 讲一讲Hive里有哪些数据格式，有什么区别- HDFS读写流程- 有用过Spark中的什么算子- 解释转换算子和行动算子的区别- Spark中的Stage如何划分的- groupBy 和 reduceBy 的区别- 讲一下数据仓库是什么## 项目- 我们的项目数据量多大- 团队组成- 我们的指标是如何变成报表的- 有遇到什么问题吗：讲的groupby的数据倾斜  - 如何解决数据倾斜的：局部聚合+全局聚合  - 怎么具体实现的：加随机前缀，这个前缀是什么，用什么加的，之后怎么消除的## 算法- DP：[322. 零钱兑换]*******************************************

查看53道真题和解析

点赞评论收藏

分享

03-07 09:48

门头沟学院大数据开发工程师

快手数开日常实习timeline

开心开心开心～人生中第一段实习 接到的第二个offer🥰（第一个offer已拒 虽然第一个厂也超级无敌厉害）2.23/2.24投递（记不清了）2.25约一面2.27一面2.28一面通过 约二面（隔着一个周末）3.4二面3.5二面通过 当天三面 三面通过 直发offer开心开心开心～面试官都超级nice，面试反馈里写了大大的好评🥰而且手子效率也太太太高了 已经在期待入职了🥰第一段实习就能进这种顶级厂 已经是我想都不敢想的事情了 写timeline攒攒人品✌🏻

点赞评论收藏

分享

03-14 14:39

苏州大学大数据开发工程师

三七互娱数开笔试

n道单选题（java、jvm...）+1道多选题（设计模式）+3道问答题（单例模式、数据分析题、sql题）记录一下不会的题吧：q1：String str1 = new String(&quot;Hello&quot;), String str2 = &quot;Hello&quot;，那么str1==str2的结果是？-》falseq2：JVM内存模型q3：写一个单例模式的线程例子，同时解释一下单例模式的原理。

投递三七互娱等公司6个岗位

点赞评论收藏

分享

03-14 10:56

华中师范大学大数据开发工程师

蔚来_数开实习_一面&二面

一面：- 飞书，没开摄像头## 项目- 重点了解一下这个离线数仓项目，你可以展开说一下吗？  - 背景，意义，人员组成，整个数据流动过程，我的职责- 你这边主要做的工作内容可以展开讲讲一下吗？  - 我这边主要的工作内容就是针对这个xx主题的两个指标进行拆解和计算。- 它是怎么计算的，可以说明一下吗？  - 我理解其实这两个指标应该都还是有一个**时间维度**  - 你们时间维度又具体是怎么设计的？是天还是周还是月，各种还是各种都有。- 那你这边再具体做了一些数据开发的工作，你可以说一下吗？就比如说你做了哪些表，以及是什么来支撑这个指标的计算的。  - **DWS表的粒度到底是用户粒度还是用户登录行为粒度？**- 就是你自己写Spark或者你自己研究Spark这里面，比如说你有没有遇到过一些比较难的问题，以及是怎么解决。  - 数据倾斜问题  - **那你就这个优化前后它的一个对比的指标是什么样。那它运行速度有变化吗？**场景sql题：- 假设我有一兆的一张表，那学生的成绩表，他有学生ID课程ID以及分数。然后我想计算每一门课程分数前三的学生，把这样的一个信息给拿出来。怎么做呢？  - rank() over(partition by c_id order by score)---二面：- 飞书，开摄像头## 项目- 介绍项目场景、全流程、个人职责- 最终产生的业务价值是什么呢？- 数据出来之后，会你的使用方是谁呢？就是会谁来用这份数据来做什么事- 实时这边有接触吗？  - flink的基本的原理有看过吗？就比如说为什么flink它它适合做什么样的事情，它能解决什么问题？  - 他这里背后的整个技术链会有哪些呢？就是比如说实时数据处理里面- Spark这个task stage和job他们是什么关系？  - 我们可以调整它的task的个数吗？- SparkSQL写得多吗- HiveSQL和SparkSQL逻辑上有什么不一样的？- 成长的规划，你大概是怎么设想的？技术上的- 像那个其实因为现在你接触实时的比较少，那后面在业务上如果有有的有这个诉求对吧？然后你准备怎么弥补这些短板？  - 比如说我们既有工作任务，又要学习你这个你觉得自己的抗压的能力够吗？

查看22道真题和解析

点赞评论收藏

分享

牛客热帖

更多

正在热议

更多

# 找工作，行业重要还是岗位重要？ #

11420次浏览 204人参与

# 国企还是互联网，你怎么选？ #

123701次浏览 960人参与

# 盲审过后你想做什么？ #

13481次浏览 119人参与

# 五一之后，实习真的很难找吗？ #

49416次浏览 349人参与

# 外包能不能当跳板？ #

22729次浏览 192人参与

# 设计人如何选offer #

99022次浏览 694人参与

# 潍柴工作体验 #

17280次浏览 17人参与

# Offer比较，求稳定还是求发展 #

39357次浏览 226人参与

# 摸鱼被leader发现了怎么办 #

41349次浏览 316人参与

# 领导秒批的请假话术 #

10782次浏览 83人参与

# 面试中，你被问过哪些奇葩问题？ #

63725次浏览 778人参与

# 五一假期，你打算“躺”还是“卷”？ #

40334次浏览 498人参与

# 一句话证明你在找工作 #

294729次浏览 2435人参与

# 每人推荐一个小而美的高薪公司 #

72968次浏览 1358人参与

# 小厂实习有必要去吗 #

42603次浏览 260人参与

# 蚂蚁集团工作体验 #

10918次浏览 70人参与

# 你觉得通信/硬件有必要实习吗？ #

92811次浏览 891人参与

# 面试等了一周没回复，还有戏吗 #

116871次浏览 1090人参与

# 我的2024小目标 #

57050次浏览 380人参与

# 实习生活中那些难忘的瞬间 #

100594次浏览 1795人参与

牛客网
牛客企业服务