驰骛科技-数据开发一面
处女面,很紧张
1. 问项目
2. 项目中为什么使用kafka作为缓冲队列。
3. mapreduce原理。
4. 如果mapreduce发生数据倾斜该如何解决。
5. 解释一下列式存储、列式存储的文件格式。
6. 星型模型、雪花模型、星座模型的区别和应用场景。
7. 拉链表是什么、一般解决什么问题。
8. 什么是指标体系、如何明确指标体系。
9. zookeeper、datax等(项目上写的组件)这些组件的原理熟悉吗?
10. Python的运用水平。
11. 能否编写shell脚本完成日常数据导入?
反问xxx
已oc
1. 问项目
2. 项目中为什么使用kafka作为缓冲队列。
3. mapreduce原理。
4. 如果mapreduce发生数据倾斜该如何解决。
5. 解释一下列式存储、列式存储的文件格式。
6. 星型模型、雪花模型、星座模型的区别和应用场景。
7. 拉链表是什么、一般解决什么问题。
8. 什么是指标体系、如何明确指标体系。
9. zookeeper、datax等(项目上写的组件)这些组件的原理熟悉吗?
10. Python的运用水平。
11. 能否编写shell脚本完成日常数据导入?
反问xxx
已oc
全部评论
请问这家公司就一轮面试吗
方便问下啥公司吗?
此处拉链表寡人认为并不是卿所指数据结构中处理哈希冲突的拉链法,而是数据处理中处理缓慢渐变维中的拉链表哦。拉链表适用于需要跟踪历史变化且数据变化较为频繁的场景,如客户信息管理、产品价格变化、客户账户余额变动等。
驰骛😂,上海这边的那是武汉?进去了嘛?哥们
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享
何青司:第一个项目感觉可以写好多东西,但只是简单的罗列技术和功能,我看到一种推荐写法是使用xxx实现(或解决)xxx功能(或问题)。再可以添加一些数据,例如实习经历你写到输出相关报告,前面也提到了文档撰写,可以加上数量,数量少则可以写“梳理出8000字文档资料”。查询数据库优化和缓存策略也可以加上数据对比,我的简历就写有一条“使用Redis缓存首页用户信息列表,将接口响应时长从4.5秒优化到47毫秒左右”,数据对比就凸显出缓存的重要性了。以上只是我的一点拙见。
点赞 评论 收藏
分享