老欧讲职场

2023-10-07 13:16 已编辑字节跳动_大数据工程师

关注

知乎数据工程师面经

接口和抽象类的区别？

接口是一种完全抽象的类，它只定义了方法的签名，而不提供方法的实现。一个类可以实现多个接口。

抽象类是一个类，它可以包含抽象方法（没有实现的方法）和已经实现的方法。一个类只能继承一个抽象类。

final关键字是什么？

final关键字可以应用于类、方法和变量。当应用于类时，表示该类不可被继承。当应用于方法时，表示该方法不可被子类重写。当应用于变量时，表示该变量是一个常量，只能被赋值一次，之后不可修改。

Flink checkpoint 是什么？

Flink checkpoint 是一种分布式快照机制，用于确保流处理应用程序的容错性。它定期保存应用程序的状态信息，包括数据流的位置和状态信息。在发生故障时，Flink 可以使用 checkpoint 来恢复应用程序的状态，从故障前的状态继续处理数据。

checkpoint 中 barrier 的两种对齐方式是什么？

Checkpoint Barrier 是一种特殊的数据标记，在 Flink 中用于表示在该点之前的数据已经被成功处理并保存到 checkpoint 中。两种对齐方式分别是 "Exactly-once" 和 "At-least-once"。

"Exactly-once" 对齐要求所有任务都在处理完 checkpoint barrier 后才能继续处理数据，以确保精确一次处理语义。

"At-least-once" 对齐允许任务在接收到 checkpoint barrier 后立即继续处理数据，但需要确保在 checkpoint 完成前的数据不会再次处理。

简要介绍 Flink 里的 Interval Join

Interval Join 是一种流处理操作，用于在两个数据流之间进行关联，但不是基于相同的事件时间戳来进行匹配，而是基于时间间隔。它允许你在一个事件发生后的一段时间内匹配另一个事件，对于处理事件的持续性窗口或实时事件的关联非常有用。

Flink 窗口函数 Sliding Time Window 为什么不设置很长的窗口时间？

Sliding Time Window 允许窗口的时间范围部分重叠，以捕获连续的数据。如果设置窗口时间太长，可能会导致窗口内的数据量过大，增加处理的复杂性和资源消耗。适当设置窗口时间可以平衡延迟和数据处理效率之间的权衡，确保及时处理数据并降低延迟。

Flink checkpoint 和 Kafka offset 的关联是什么？

Checkpoint 用于记录 Flink 应用程序的状态，而 Kafka offset 用于记录消费 Kafka 主题的位置。通常，Flink 的 Kafka 消费者会与 checkpoint 结合使用，以确保在故障恢复后不会重复处理 Kafka 中的消息。Flink 框架提供了 Kafka 消费者的集成，自动管理 Kafka offset 的提交，不需要手动编写 offset 提交逻辑。

简要介绍 Flink 状态后端的作用。

状态后端是 Flink 用于管理和存储应用程序状态的组件。它负责将应用程序的键控状态（Keyed State）和操作符状态（Operator State）持久化到后端存储系统中，以便在故障恢复时恢复状态。

Flink 里通常使用哪种状态后端，优势分别是什么？

通常选择状态后端取决于应用程序的需求。常见的状态后端包括 MemoryStateBackend、RocksDBStateBackend 和 FileStateBackend。

MemoryStateBackend 适用于开发和调试，但不适合生产环境，因为不具备持久性。

RocksDBStateBackend 适用于生产环境，具有高性能和持久性，可处理大规模状态数据。

FileStateBackend 类似于 RocksDB，但状态存储在文件系统中。选择状态后端时需要考虑性能、持久性和资源需求。

Flink MemoryStateBackend 一定不能用吗？缺点是什么

MemoryStateBackend 不适合生产环境，因为它将所有状态存储在内存中，具有以下缺点：

不具备持久性，即如果应用程序失败或需要重启，所有状态数据将丢失。

内存有限，无法处理大规模的状态数据。不适合长时间运行的应用程序。

大数据欧老师 - 面试真题分享文章被收录于专栏

解决职场真实面试问题，分享同学真实成功案例，欢迎订阅关注！

全部评论

推荐最新楼层

05-12 21:10

暨南大学嵌入式软件开发

211，找嵌软方向实习，友友们帮忙看看简历有哪些问题

简历求拷打，前面几版简历在boss上投了后基本没有回应，都快六月，找不到实习。

听劝，我这个简历该怎么改...

点赞评论收藏

分享

05-12 14:26

长沙理工大学 C++

怎么看待跳槽是涨薪最快的方式？应届第一份工作建议干多久？

网友提问：怎么看待跳槽是涨薪最快的方式？应届第一份工作建议干多久？Yt回复：一、跳槽涨薪的“黄金时代”过去十几年，跳槽涨薪是一种常态。有些人涨50%，有些人直接double。这种涨薪比例，催生了一种心态：不要给我谈管理，我不会转管理不要给我谈股权，反正我待不久一年两年，干满就换有了这家公司的薪资流水，下一次换工作就会涨于是，频繁跳槽成为了一种“聪明”的选择。二、频繁跳槽的后果：简历半页纸都是公司我见过很多朋友，两年三跳。整个工作经历十年，半页纸都是所待的公司。有时候他们还问我：“king老师，这里中间有没有一些可以删掉的？”我说：这都是你自己干的事，你怎么可能删掉？社保经历十几段，简历里半页纸...

点赞评论收藏

分享

05-14 18:58

已编辑

门头沟学院 Java

好奇谁在挣这么多钱？

字节和腾讯给AI相关人才开的好多啊，好好奇这些人的bg，有了解的佬路过说说吗？得什么水平才能在实习期挣这么多钱呢？

WzhHL：清北博+对口A+对口实习吗

点赞评论收藏

分享

04-22 20:47

西安电子科技大学 C++

被学校发现实习被迫终止

友友们，本来在一个做自动驾驶的大厂实习，但因为长时间没刷宿舍门禁刷脸被导员发现，后面被拷问出来在实习后也是迫于压力离职了。但是我争取了一下，公司那边说是如果暑假还有hc的话我可以继续入职。但是只是口头承诺，我很焦虑到时候一句没有hc了就炸了（暑期目前只有一个小厂offer，四月才开始投，两个月生疏八股算法，感觉拿别的大厂暑期实习无望了）  友友们有什么建议吗？比如我要不要持续跟hr聊天来增加些好感度之类的？

XingHaozhe：改变命运的机会就这么多，能不能顶住别人的阻挠与质疑也是对我们人生的考验

点赞评论收藏

分享

评论

5

34

招聘动态

快手

27届实习超多转正机会

上海人工智能实验室

2026年春季校园招聘

27届校招宝典

网申助手插件

校招信息网申列表

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 26届春招投递记录 #

24960次浏览 174人参与

# 投递几十家公司，到现在0offer，大家都一样吗 #

373968次浏览 2298人参与

# 我的求职总结 #

502616次浏览 7004人参与

# 腾讯工作体验 #

642091次浏览 3875人参与

# 27届实习投递记录 #

101117次浏览 1014人参与

# 摸鱼被leader发现了怎么办 #

206195次浏览 935人参与

# 实习的内耗时刻 #

239947次浏览 1655人参与

# 今年秋招哪家公司给的薪资最良心？ #

486830次浏览 2597人参与

# 你后悔选择现在的专业吗 #

126442次浏览 715人参与

# 春招开局，你有保底offer吗？ #

146040次浏览 696人参与

# 秋招投简历越早越好吗 #

117587次浏览 858人参与

# 你遇到过哪些神仙同事 #

146423次浏览 776人参与

# 材料专业可以靠半导体脱坑吗？ #

41568次浏览 156人参与

# 金融财会交流会 #

153168次浏览 504人参与

# 如何看待应届生身份？ #

257216次浏览 2361人参与

# 24届硬件人与华为的爱恨情仇 #

162588次浏览 1014人参与

# 牛客AI体验站 #

31367次浏览 444人参与

# AI岗位暴涨12倍，你会转AI赛道吗？ #

25892次浏览 213人参与

# 秋招提前批启动你开冲了吗 #

194223次浏览 2260人参与

# 滴！实习打卡 #

858475次浏览 6887人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务