万兴科技数开实习一面

- 全程项目拷打,基本上没有八股
- 腾讯会议,开视频

## 面评

- 知识面太窄了
- 工作职责太少了
- 流程不熟悉
- 基础知识:组件原理、优化方式

## 项目

- 整个项目的流程是怎么样的
- 讲一下整个项目的技术栈
  - 数据同步用的啥
  - Hive on Spark吗
  - 数据可视化用的啥
- 日志数据有什么
- 某个业务这个行为是作为一个什么数据参与到项目中的
  - 日志吗
- 业务数据量有多大
- 日活月活
- 该ads表有什么数据项,dws表-dwd表-dim表的数据项
- 讲一讲我负责的指标
  - 指标业务逻辑
  - 指标在业务背景是什么样的(合理性)
  - 指标场景质疑
- 有哪些数据域、主题域
- 有没有用过云数据库
- DolphinScheduler的处理过程
  - 我们做ads指标是自己去写的脚本吗
  - 怎么写的

---

都没有问sql实现逻辑

## 八股

- 数据倾斜给我出了一个场景:groupby的时候出现倾斜
  - 我提了join倾斜情况
- map join怎么处理小表太占内存,把内存挤爆的问题
全部评论
这公司恶心人,日常还发测评
1 回复 分享
发布于 昨天 11:01 北京

相关推荐

# 一面- 电话面## 面评- 丰富离线数仓的经验- 对自己的这个职业的规划是怎么规划的?## 项目- 这个项目是你是从0到1参与的吗?- Hadoop我有参与部署吗- 开发用的Spark SQL吗- 在用Hive on Spark的过程中有遇到什么问题吗?怎么解决的- 数据是怎么怎么来的?## 八股- 你对数仓是怎么理解的?就是什么情况下会用到数仓,就算他比如说我正常的数据库啥的也都能用,它有什么比较大的区别,或者它的优势是啥?  - 数仓的概念  - 数仓和数据库的比较- 数据倾斜都有哪些原因产生的,怎么解决?- SQL的优化有了解过吗  - 我说的是小文件的优化,应该说谓词下推等sql优化- 数仓的建模方法有了解过吗  - 维度建模简单的说一下  - 有没有尝试过其他的模型- hadoop什么HDFS读数据的一个流程  - block默认大小是多大?- shuffer的一个过那个原理能简单说一下吗?  - map阶段他都做了哪些事儿呢?  - 排序放在哪个阶段了?# 二面- 无八股,深挖项目亮点,交流课外经历## 项目- 这个项目是个什么性质?- 那你们这个团队有多少人?然后大概分工是怎么分工的?- 你们在日常使用的过程中有遇到一些问题吗?就是不管是故障,还是说需要去调优什么之类的。- 执行日常运行过程中有有会有故障什么之类的产生吗?或者问其他问题产生吗?- 关于本科课外实验室经历聊天- 那在这个实验室的两年多的时间,对你个人而言有什么影响吗?或者是说取得了什么样的成果?- 关于本科课外球队经历聊天- 现在整个AI这块特别火。我不知道你们对你们有没有一些你或者有些感触,或者说对你们在学校的学习有有一些什么影响。- 使用过什么ai工具,有什么对比区别
查看22道真题和解析
点赞 评论 收藏
分享
评论
1
3
分享

创作者周榜

更多
牛客网
牛客企业服务