2025秋招经验分享-字节一面

推荐阅读文章列表

大数据开发面经汇总【持续更新...】

我的大数据学习之路

大数据开发面试笔记V6.0

面试经验

来自牛客#数据人的面试交流地

1.自我介绍

2.项目内容:背景,uv,pv,功能,项目人数,分工

3.数仓的设计思路

4.分层数仓和使用普通数仓的区别

5.为什么ods不直接对接app层

6.项目用了哪些技术栈

7.hdfs如何保证高可用

8.hdfs写入数据流程,写入过程中datanode挂了怎么办

9.小文件原因,危害,解决方法

10.数据倾斜介绍,数据倾斜如何排查

11.spark的两种shuffle

12.sql题:商铺的最大销量的类目

13.设计题:数据量pb级别,要获取近30天和近90天的活跃用户uv,设计表和查询逻辑

难点解析

大数据面试笔记6.0基本涵盖上述问道的所有八股文,重点说一下开放题:第2题和第13题

Q1: 为什么ods不直接对接app层

  • 不太建议app层直接依赖ods层,因为ods层对接的是在线系统,而app层对接的是业务应用,一旦在线系统发生变更,数据影响会直接穿透到app层,影响业务应用,因此中间层的一点好处就是屏蔽上游业务系统对于下游应用的影响

Q2: 数据量pb级别,要获取近30天和近90天的活跃用户uv,设计表和查询逻辑

  • 第一种思路:将用户id转换为bitmap来进行存储,然后基于bitmap位运算来提高计算效率
  • 第二种思路:在昨日计算最近30天用户uv的同时进行预计算,对最近29天的userid进行去重,今日计算时只需要和昨日预计算的结果进行去重即可;
  • 第三种思路:用一张中间表存储用户最近一次登录时间,如果需要求最近30天登录用户数,那么直接基于中间表获取最近一次登录时间在30天内的用户即可

思考题

如何用一张中间表存储用户最近一次登录时间?

#数据人的面试交流地##大数据开发##2025秋招#
全部评论

相关推荐

09-02 18:33
已编辑
门头沟学院 Java
抖音开放平台     9/2 一面时长: 1 小时字节的面试官真的超级好,超级有礼貌,面试的过程中给了很多的指导四个流程:1、自我介绍  2、项目和难点挑战  3、手撕    4、反问让讲一个自己觉得最好的项目,为什么做这个项目?  难点在哪里?  怎么解决的?1、springSecurity      JWT的组成(深挖) (MD5和雪花的区别    深挖)密码学中相关的对称加密和非对称加密(问了密码学相关的一些,只能靠自己的理解去说,没学过密码学,可能是因为提到了安全?)2、幂等性和自定义注解,给场景3、kafka的基本架构,和其他MQ的区别,优势(之后深挖Kafka的内在-- 削峰填谷)   数据一致性(给个场景  问流程)4、Redis分布式锁,setnx  --->   LUA脚本    ---->    Redisson5、项目中Mysql的使用,怎么设计的,分库分表的设计(垂直水平)(分库中不同数据库池怎么办?实际的抖音场景分析   这个问题答的不好)   (给个场景  事务和索引)6、深挖布隆过滤器,误差(这个问题答的也不好,我说是由于数据结构引起的),大小7、Redis中的缓存穿透,雪崩,击穿原因,解决方法 (给个场景)。。。。。。。。。。。。剩下的还有一些,记不得了,问的很细致,深挖项目,知识点的场景使用手撕:1221 分割平衡字符串   (先讲对题目的理解,然后说思路,动态规划)反问:对我有什么建议?(基础挺牢固的,实践能力也行,但是有些深度不够,只会用,不理解本质,听到这儿感觉应该是寄了hhhh)   抖音开放平台是做什么的,具体的业务是什么?(类似于微信小程序)面试下来感觉收获了很多,字节的面试官真的是所有里面最有礼貌的,技术方面感觉也很强,有些问题没答出来也会引导去作答,大概就是让我像教一个小白一样去讲解自己的项目,然后在讲解的过程中进行提问和项目深挖,还有知识点在真实场景下的应用。还不知道结果,但是感觉悬了,虽然面试的过程也学到了很多
字节跳动一面759人在聊 查看10道真题和解析
点赞 评论 收藏
分享
点赞 1 评论
分享
牛客网
牛客企业服务