百度-大数据研发工程师面经

8月22日三面结束,一直在等结果
校招进展是offer评估阶段

面经:
一面
redis:
RDB和AOF的区别
AOF中记录的是什么,RDB中记录了什么
过期数据的删除策略
使用这些删除策略可能会出现哪些问题
定期删除是所有数据删除吗
内存淘汰机制
allkeys详细说说
redis使用场景
redis和memcached有什么区别
为什么用单线程不用多线程

clickhouse(实习里用的主要是这个):
简单介绍一下clickhouse,说说为什么用这个
说一下Rollup
OLAP和mysql的区别

算法题:
LRU
滑动窗口最大值(我先用了优先队列,面试官让我优化,后面用单调队列)

二面
了解过数仓吗?
为什么用clickhouse 不用mysql,说一下底层有什么区别
百度贴吧,人均发帖量减少,如何看减少的原因,并提出一个优化方案(尽量从技术方面回答)
618评估销量好不好,从数据分析的角度,怎么分析入手
想知道聚集效应是因为时间点的原因还是因为促销的原因,怎么做

sql题:
262.行程和用户

三面(两个小时)
主要是做题+聊天
先聊了聊实习经历,然后讲一讲hadoop

题1:验证IP地址
题2:判定异常用户
题3:删除系统中的重复文件夹(没做出来,但说了思路是正确的)

#百度# #秋招##面经#
全部评论
请问是啥部门呀?
点赞 回复 分享
发布于 2024-04-20 10:48 美国

相关推荐

- 不问八股,不问项目,纯场景题考核,**以下问题均在电商下单的业务背景下**- 知道ER模型和维度模型吗  - 不要介绍概念,接下来以电商场景中的下单过程为背景,分别用两种模型诠释一下这个业务过程- ER模型中有这个下单过程有哪些实体哪些关系  - 商品和消费者的关系是多对多的吗- 维度模型中会有哪些维度表和哪些事实表- 线下的pos系统的数据和我们建表数据格式不一致,如何处理  - 数据清洗和数据格式转换- 业务场景:需要找到国庆期间的无效订单数量  - 无效订单:已下单未发货,已下单发货超过3天  - 订单表:订单id 时间  - 发货表:订单id 发货id 时间- 如果要连接这两个表,用什么join,为什么  - left,因为有订单信息不一定有发货信息,要保证订单信息的完整- 一个需求实现的全流程是什么样的  - 需求->分析其逻辑,划分出集合->对数据进行建模->清洗数据->写SQL->优化SQL- 这个全流程中,你认为ai可以协助数据开发工程师做哪一些工作  - 全部都可以协助,但是需要人工比对和把关- 那么如果AI可以做到整个全流程,数据开发工程师的价值又在哪里  - 目前已经有ai可以实现业务需求的全流程
查看22道真题和解析
点赞 评论 收藏
分享
不愿透露姓名的神秘牛友
昨天 10:25
亚马逊 开发 50w 博士其他
点赞 评论 收藏
分享
评论
10
23
分享

创作者周榜

更多
牛客网
牛客企业服务