腾讯云智 数开实习 面试凉经
4.1笔试
4.10一面
腾讯云智 数开实习
面试凉经
(回答的实在依托,我自己都受不了自己😅)
自我介绍
说下你的项目
项目为什么要分不同的主题域
项目各个分层是为了什么,为什么要分层
order by sort by cluster by distribute by这几个算子的区别
有一个表有userid login_time,统计用户最长连续登录天数,说说思路,然后有没有考虑过全量表下的场景
数据倾斜怎么处理(给场景)
数据加盐怎么做
小文件为什么产生,怎么解决
map join
zookeeper在大数据组件中的作用
zookeeper存hadoop的元数据吗
使用过哪些部署hadoop集群的方式
使用什么管理hadoop集群
如果有一个报表,某个数值异常或者发现错误,如何进行排查,然后如果是数据源有问题,从几百个源表中如何快速定位到出问题的表
突然某一天,某个工作流执行的时间比往常慢了,如何排查,如何解决
熟悉哪些编程语言
有没有通过Java编写过udf函数,udf函数需要实现哪些方法
udaf函数和udtf函数介绍下区别(从输入和输出角度)
处理过流数据吗
流处理如何保证数据一致性,如何保证数据不丢失
介绍下自己的优缺点
怎么看待大模型
你觉得你有哪些优势在刚刚的提问中没有展现出来,你可以展示下
反问环节
没有手撕环节
只记得大概这么多了,没按顺序,凉透了 好多问题答不上来,太菜了😭,面试官很漂亮,人也真的很好#数据人的面试交流地# #数据人offer决赛圈怎么选# #牛客创作赏金赛#
4.10一面
腾讯云智 数开实习
面试凉经
(回答的实在依托,我自己都受不了自己😅)
自我介绍
说下你的项目
项目为什么要分不同的主题域
项目各个分层是为了什么,为什么要分层
order by sort by cluster by distribute by这几个算子的区别
有一个表有userid login_time,统计用户最长连续登录天数,说说思路,然后有没有考虑过全量表下的场景
数据倾斜怎么处理(给场景)
数据加盐怎么做
小文件为什么产生,怎么解决
map join
zookeeper在大数据组件中的作用
zookeeper存hadoop的元数据吗
使用过哪些部署hadoop集群的方式
使用什么管理hadoop集群
如果有一个报表,某个数值异常或者发现错误,如何进行排查,然后如果是数据源有问题,从几百个源表中如何快速定位到出问题的表
突然某一天,某个工作流执行的时间比往常慢了,如何排查,如何解决
熟悉哪些编程语言
有没有通过Java编写过udf函数,udf函数需要实现哪些方法
udaf函数和udtf函数介绍下区别(从输入和输出角度)
处理过流数据吗
流处理如何保证数据一致性,如何保证数据不丢失
介绍下自己的优缺点
怎么看待大模型
你觉得你有哪些优势在刚刚的提问中没有展现出来,你可以展示下
反问环节
没有手撕环节
只记得大概这么多了,没按顺序,凉透了 好多问题答不上来,太菜了😭,面试官很漂亮,人也真的很好#数据人的面试交流地# #数据人offer决赛圈怎么选# #牛客创作赏金赛#
全部评论
相关推荐
04-10 20:40
哈尔滨工程大学 golang 
点赞 评论 收藏
分享