首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
在线笔面试、雇主品牌宣传
登录
/
注册
懒得低眉
获赞
19
粉丝
15
关注
1
看过 TA
95
第一拖拉机制造厂拖拉机学院
2026
大数据开发工程师
IP属地:美国
暂未填写个人简介
私信
关注
拉黑
举报
举报
确定要拉黑懒得低眉吗?
发布(4)
评论
刷题
收藏
懒得低眉
关注TA,不错过内容更新
关注
2024-12-17 16:27
已编辑
第一拖拉机制造厂拖拉机学院 大数据开发工程师
携程数据仓库日常实习面筋
面试前一天上午和我说晚上面试官在高铁上,改时间到第二天下午数据仓库的介绍,项目的数仓怎么设计的数仓分层问题,每一层的数据流向。会从ods层取数据吗,什么时候会向dws层取数据,什么时候会从dwd层取数据。新业务来了数仓怎么扩展业务总线矩阵横纵坐标代表什么,维度冗余情况介绍ER模型和维度模型优缺点什么是业务过程,什么是粒度。(我简单说了一下,也举了个例子说明。但是让我用抽象的定义语言来阐述)Hive的存储格式。orc列式存储的压缩方法,为什么orc读取数据快。有没有看过orc的相关文档Hive的一些优化经验和方法Spark3.X的新特性有哪些。Spark的常见的action算子和transfor...
查看15道真题和解析
0
点赞
评论
收藏
分享
2024-12-14 17:43
第一拖拉机制造厂拖拉机学院 大数据开发工程师
滴滴数据研发日常实习凉经
一面数据仓库认识维度建模之外还有哪些建模,有什么区别项目中数据仓库分了哪几层,为什么要分层Hadoop架构,你这些组件中选一个最熟悉的说(这问题也太友好了,我选了MapReduce,说了一下流程)怎么实现分区,环形缓冲区溢写的分区和后续Reduce的分区一样吗环形缓冲区里的快排是怎么实现的,是对数据快排吗简述了一下快排的过程,时间空间复杂度时间复杂度和空间复杂度的区别,原理,怎么计算。举个例子说明。Hive的介绍,对Hive的认识,用处项目的数据流向,数据链路搭建两道sql,共享屏幕手撕。一个是每一天最早登录的三个人的信息,第二个是连续登陆问题。一面下来感受很好,除了面试时候迟到了20分钟左右...
查看13道真题和解析
0
点赞
评论
收藏
分享
2024-12-12 17:45
已编辑
第一拖拉机制造厂拖拉机学院 大数据开发工程师
快手数据开发日常实习一面
数据开发日常实习的一面,也是我的第一面。投简历的时候没想到会这么快,上午投的简历,晚上就打电话约第二天面试,自己完全没准备好,以为会有一个礼拜左右缓冲时间。和hr约了第三天面。首面还是非常紧张,问的问题很多都回答不上来,表现很差。后续一个礼拜没有联系,应该是g了自我介绍,介绍一下项目以及项目中用到的一些大数据组件HDFS的文件存储格式有哪些(这个真没想起来)MapReduce过程,MapTask和ReduceTask个数怎么确定MapReduce阶段哪些因素会影响性能Flink和Spark Streaming的区别数仓建模理论主题域和数据域的区别(这个问题一开始没听懂,后来感觉应该想问主题的确...
应届想染班味:
快手有暗号听说,面试官说了感谢你的时间就是寄了完全不用期待和等待了
。没说才是有机会 听别人说的
查看11道真题和解析
0
点赞
评论
收藏
分享
2024-11-24 14:26
已编辑
第一拖拉机制造厂拖拉机学院 大数据开发工程师
题解 | #2021年11月每天新用户的次日留存率#
首先想法是确定新用户的留存率怎么算,这里其实和之前留存率的想法一样,就是加上了新用户的限制。原来是:N日留存用户数/某日活跃用户数 。现在变成:次日留存新用户数/某日活跃的新用户数那么问题关键是如何确定这个用户是否是新用户,我想到的是,找到每一个用户的最小登录日期,也就是首日登录,作为字段拼接。后续只要判断用户的这一天日期是否和这个字段相等,就可以判断是否是新用户: select uid, min(date (in_time)) first_day from ...
0
点赞
评论
收藏
分享
1
创作者周榜
更多
关注他的用户也关注了:
牛客网
牛客企业服务