老欧讲职场

01-20 15:55 字节跳动_大数据工程师

关注

实时大数据面试题 - 流处理、批处理和微批处理

1. 数据处理模型：流处理、批处理和微批处理

我们首先来认识一些基本的数据处理模型。在大数据世界中，你会遇到流处理、批处理和微批处理这三种模型。

流处理是一种实时的数据处理方式，数据一生成就立即被处理，无需等待。其连续且高效的特性使得它适用于需要实时分析结果的场景，例如实时股票市场分析或网络监控。流处理的代表有 Apache Flink 和 Apache Storm。

相比之下，批处理增加了一个数据积累阶段，仅在数据达到一定量时才进行处理。这种模式适用于不需要实时响应的场景，比如零售业的日销售数据分析。Hadoop MapReduce 则在批处理领域卓有成效。

最后，微批处理作为一种折衷策略，介于流处理和批处理之间，定期处理小批量数据。Apache Spark 的 Spark Streaming 是微批处理的一个典型代表。

2. 流处理系统的框架对比：Flink vs Spark Streaming

了解了处理模型，接下来我们对比一下 Flink 和 Spark Streaming 这两个常用的流处理框架。

首先，相比起 Spark Streaming 的微批处理模式，Flink 提供了真正的流处理模式，这意味着它能在更低的延迟内处理大量流数据。

其次，Flink 利用事件时间处理数据，这让我们能更精准地处理带有时间戳的事件数据，并在有数据乱序情况时也能保证结果的精准度。

再次，Flink 提供了先进的状态管理和容错机制：概念化的保存点 (Savepoints) 和状态后端 (State Backends)，使得我们能在系统发生故障时恢复到之前的状态，保证数据处理的一致性。

最后，Flink 还拥有出色的流水线执行模型，能够在高度并行的情况下，提供高吞吐量的数据处理。

3. 流处理的本质：并非一次处理一条数据

有一种误解是将流处理误认为是每次只处理一条数据，这是不正确的。确切来说，流处理系统每次会处理一个数据块（batch），并且在 Flink 中，task 与 task 之间甚至还有缓冲区（buffer）。这样的设计保证了在实时处理的同时，大数据处理也能拥有高吞吐量，充分体现了 Flink 的流处理优势。

有大数据面试相关问题欢迎评论区提问或者找我交流！

#大数据##大数据工程师##大数据知识体系##大数据面试##大数据面经#

大数据欧老师 - 面试真题分享文章被收录于专栏

解决职场真实面试问题，分享同学真实成功案例，欢迎订阅关注！

全部评论

推荐最新楼层

11-19 15:04

已编辑

重庆邮电大学测试工程师

Shopee hr 面（2024.11.19）

13分钟，没有自我介绍，面试官迟到了10分钟你觉得前面面试官怎么样？上一段实习有留用申请吗？为什么选择测试？目前手上的offer以及应聘进度，给的薪资是多少？是保研的吗？为什么选择读研？在哪了解的虾皮？可以提前实习吗？反问：部门如何分配？（1，2面试官在的大部门），面试反馈结果（还没听到结果发放通知，早的话一周，一般两到三周以上）

查看10道真题和解析

点赞评论收藏

分享

11-20 16:11

深圳大学 C++

校招要不要进互联网大厂一定要想清楚!

我现在已经在这家大厂工作了一年，感受到了其中的种种挑战与压力，确实挺痛苦的。每一天都在思考，这样的选择是否真的适合我。希望大家在做决定时，能多想想自己的未来和内心的真实感受。

过关斩将结果败给排序：其实我们双非，国企银行大概率进不了，互联网大厂已经是最好的去处了吧，中小厂不是更差

牛客创作赏金赛

点赞评论收藏

分享

10-15 23:16

河海大学成人教育学院 C++

同为笔试。。有底气了，不做了

hso_：哈哈哈哈哈哈我没offer一样在同一道题开喷了

投递深圳同为数码等公司10个岗位

点赞评论收藏

分享

11-08 18:50

已编辑

转转_基础架构_Java开发工程师

二本学院鼠鼠也是有offer了

社招1年经验，终于也是拿到offer了timeline10.31 一面11.5 二面+hr面11.6三面11.7 oc11.8 offer

二本牛马：大佬又让我看见了希望

点赞评论收藏

分享

11-20 12:02

门头沟学院产品经理

秋招夯大力

我叫夯大力，本科时我以为只要我努力学习，考上研究生，毕业后大企业随便挑，月薪轻轻松松过w过上幸福生活；结果现在天天对破电脑写论文写到哭，秋招也一言难尽......哎

在吐槽的山羊很喜欢后仰跳投：学历和专业，中国人自己的种姓制度

秋招被确诊为……

点赞评论收藏

分享

点赞 1 评论

招聘动态

杉川机器人

2025校园招聘

字节跳动

2025校园招聘

字节跳动Data

2025校园招聘

快手Star

2025届招聘

快手

销售类投递专区

库洛游戏

全站热榜

正在热议

# 25届秋招总结 #

242104次浏览 1976人参与

# 学历or实习经历，哪个更重要 #

40488次浏览 294人参与

# 北方华创开奖 #

22460次浏览 256人参与

# 地方国企笔面经互助 #

2466次浏览 6人参与

# 你最想要的公司福利是？ #

39136次浏览 108人参与

# 选完offer后，你后悔学本专业吗 #

9594次浏览 73人参与

# 面试题刺客退退退 #

136651次浏览 2087人参与

# 应届生被毁约被毁意向了怎么办 #

26519次浏览 236人参与

# 查收我的offer竞争力报告 #

16211次浏览 220人参与

# 机械应届生薪资要多少才合适？ #

12319次浏览 59人参与

# 一觉醒来，我觉醒了超级打工人系统 #

2755次浏览 34人参与

# 没有实习经历，还有机会进大厂吗 #

804533次浏览 13806人参与

# 你觉得第一学历对求职有影响吗？ #

14799次浏览 121人参与

# 我的工作日记 #

21007次浏览 270人参与

# 不给转正的实习，你还去吗 #

1515960次浏览 16962人参与

# 寒假躺平还是提前实习 #

58017次浏览 430人参与

# 总结:哪家公司面试体验感最差 #

25423次浏览 128人参与

# 秋招OC许愿 #

225978次浏览 1863人参与

# 秋招被确诊为…… #

53913次浏览 302人参与

# 如何写一份好简历 #

600755次浏览 8412人参与

# 今年形式下双非本找得到工作吗 #

43793次浏览 414人参与

牛客网
牛客企业服务