字节_数开实习_一面

- 飞书面试间,在飞书上撕代码
- 问了很多计算机基础八股,痛击薄弱点

## 八股

- 讲一讲线程池
- Java实现线程的几种方法,有什么区别
- 线程池的具体参数
- 进程和线程的区别
- java中如何控制进程内存
- 讲一讲数据库的事务是什么
- 讲一讲数据库中的锁有哪些
- 讲一讲对索引的理解
- 如何存储索引的
- B树和B+树存储索引的区别
- 相同数据量下,B树和B+树哪一个查询更快
- http和https
- 讲一讲TCP
- 讲一讲Hive里有哪些数据格式,有什么区别
- HDFS读写流程
- 有用过Spark中的什么算子
- 解释转换算子和行动算子的区别
- Spark中的Stage如何划分的
- groupBy 和 reduceBy 的区别
- 讲一下数据仓库是什么

## 项目

- 我们的项目数据量多大
- 团队组成
- 我们的指标是如何变成报表的
- 有遇到什么问题吗:讲的groupby的数据倾斜
  - 如何解决数据倾斜的:局部聚合+全局聚合
  - 怎么具体实现的:加随机前缀,这个前缀是什么,用什么加的,之后怎么消除的

## 算法

- DP:[322. 零钱兑换]*******************************************
全部评论
佬是什么部门呀
点赞 回复 分享
发布于 03-07 21:49 广东

相关推荐

#腾讯云智研发2025实习生招聘# 4.1笔试4.10一面4.17二面(本来应该是4.15,但是那天网络不太行推迟了)腾讯云智 数开实习面试凉经(回答的实在依托,我自己都受不了自己😅)自我介绍说下你的项目项目为什么要分不同的主题域项目各个分层是为了什么,为什么要分层order by sort by cluster by distribute by这几个算子的区别有一个表有userid login_time,统计用户最长连续登录天数,说说思路,然后有没有考虑过全量表下的场景数据倾斜怎么处理(给场景)数据加盐怎么做小文件为什么产生,怎么解决map joinzookeeper在大数据组件中的作用zookeeper存hadoop的元数据吗使用过哪些部署hadoop集群的方式使用什么管理hadoop集群如果有一个报表,某个数值异常或者发现错误,如何进行排查,然后如果是数据源有问题,从几百个源表中如何快速定位到出问题的表突然某一天,某个工作流执行的时间比往常慢了,如何排查,如何解决熟悉哪些编程语言有没有通过Java编写过udf函数,udf函数需要实现哪些方法udaf函数和udtf函数介绍下区别(从输入和输出角度)处理过流数据吗流处理如何保证数据一致性,如何保证数据不丢失介绍下自己的优缺点怎么看待大模型你觉得你有哪些优势在刚刚的提问中没有展现出来,你可以展示下反问环节没有手撕环节只记得大概这么多了,没按顺序,凉透了 好多问题答不上来,太菜了😭,面试官很漂亮,人也真的很好二面更新了解了下学校课程,深挖项目,出了几个场景题,我回答得很一般,不过从问题中确实学到了很多,以前只会背的一些知识突然就理解了,面试真能带来进步啊。面试官依然很好,很友好,问题也很清楚,生怕你不知道在问什么,给你解释得清清楚楚不愧是大厂#数据人的面试交流地# #数据人offer决赛圈怎么选# #牛客创作赏金赛# #牛客AI配图神器#
查看72道真题和解析 数据人的面试交流地
点赞 评论 收藏
分享
评论
点赞
14
分享

创作者周榜

更多
牛客网
牛客企业服务