驰骛科技-数据开发一面

处女面,很紧张

1. 问项目
2. 项目中为什么使用kafka作为缓冲队列。
3. mapreduce原理。
4. 如果mapreduce发生数据倾斜该如何解决。
5. 解释一下列式存储、列式存储的文件格式。
6. 星型模型、雪花模型、星座模型的区别和应用场景。
7. 拉链表是什么、一般解决什么问题。
8. 什么是指标体系、如何明确指标体系。
9. zookeeper、datax等(项目上写的组件)这些组件的原理熟悉吗?
10. Python的运用水平。
11. 能否编写shell脚本完成日常数据导入?

反问xxx

已oc
全部评论
请问这家公司就一轮面试吗
1 回复 分享
发布于 06-24 12:31 江苏
方便问下啥公司吗?
点赞 回复 分享
发布于 06-14 21:00 陕西
此处拉链表寡人认为并不是卿所指数据结构中处理哈希冲突的拉链法,而是数据处理中处理缓慢渐变维中的拉链表哦。拉链表适用于需要跟踪历史变化且数据变化较为频繁的场景,如客户信息管理、产品价格变化、客户账户余额变动等。
点赞 回复 分享
发布于 06-27 08:26 北京
驰骛😂,上海这边的那是武汉?进去了嘛?哥们
点赞 回复 分享
发布于 07-13 22:28 上海

相关推荐

6 10 评论
分享
牛客网
牛客企业服务