脉脉——数开实习

1.项目拷打
2.数仓分层设计是怎样的?各层的作用是什么?
3.数据质量监控(DQC)如何配置?
4.事实表与维度表的区别是什么?举例说明。
5.数仓常用模型(星型模型、雪花模型)的区别及优缺点。
6.表关联方式有哪些?之间有什么区别
7.如何处理数据倾斜问题?
8.发现表中主键重复时,如何排查和解决问题?
9.Linux命令

sql题
1.group by +聚合函数
2.排序窗口函数
3.行转列

#牛客AI配图神器#
全部评论
都多少年了还这些问题数仓真是重业务轻技术呀
点赞 回复 分享
发布于 04-08 15:01 北京
在官网投的吗
点赞 回复 分享
发布于 03-30 08:35 山东
DQC配置求解
点赞 回复 分享
发布于 03-06 17:09 河北
数仓分层好难
点赞 回复 分享
发布于 03-06 14:06 安徽

相关推荐

#腾讯云智研发2025实习生招聘# 4.1笔试4.10一面4.17二面(本来应该是4.15,但是那天网络不太行推迟了)腾讯云智 数开实习面试凉经(回答的实在依托,我自己都受不了自己😅)自我介绍说下你的项目项目为什么要分不同的主题域项目各个分层是为了什么,为什么要分层order by sort by cluster by distribute by这几个算子的区别有一个表有userid login_time,统计用户最长连续登录天数,说说思路,然后有没有考虑过全量表下的场景数据倾斜怎么处理(给场景)数据加盐怎么做小文件为什么产生,怎么解决map joinzookeeper在大数据组件中的作用zookeeper存hadoop的元数据吗使用过哪些部署hadoop集群的方式使用什么管理hadoop集群如果有一个报表,某个数值异常或者发现错误,如何进行排查,然后如果是数据源有问题,从几百个源表中如何快速定位到出问题的表突然某一天,某个工作流执行的时间比往常慢了,如何排查,如何解决熟悉哪些编程语言有没有通过Java编写过udf函数,udf函数需要实现哪些方法udaf函数和udtf函数介绍下区别(从输入和输出角度)处理过流数据吗流处理如何保证数据一致性,如何保证数据不丢失介绍下自己的优缺点怎么看待大模型你觉得你有哪些优势在刚刚的提问中没有展现出来,你可以展示下反问环节没有手撕环节只记得大概这么多了,没按顺序,凉透了 好多问题答不上来,太菜了😭,面试官很漂亮,人也真的很好二面更新了解了下学校课程,深挖项目,出了几个场景题,我回答得很一般,不过从问题中确实学到了很多,以前只会背的一些知识突然就理解了,面试真能带来进步啊。面试官依然很好,很友好,问题也很清楚,生怕你不知道在问什么,给你解释得清清楚楚不愧是大厂#数据人的面试交流地# #数据人offer决赛圈怎么选# #牛客创作赏金赛# #牛客AI配图神器#
查看72道真题和解析 数据人的面试交流地
点赞 评论 收藏
分享
评论
5
10
分享

创作者周榜

更多
牛客网
牛客企业服务