首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
在线笔面试、雇主品牌宣传
登录
/
注册
调皮的山羊在写bug
获赞
22
粉丝
18
关注
30
看过 TA
165
女
南方科技大学
2026
数据仓库
IP属地:广东
求offer~
私信
关注
拉黑
举报
举报
确定要拉黑调皮的山羊在写bug吗?
发布(12)
评论
刷题
收藏
调皮的山羊在写bug
关注TA,不错过内容更新
关注
南方科技大学 数据仓库
@Java抽象带篮子:
史上最强苍穹外卖话术
烫
0
点赞
评论
收藏
分享
02-15 12:13
南方科技大学 数据仓库
美团数据挖掘
岗位名是数据开发,实则是做数据挖掘的组。问了很多算法😅1.介绍spark2.hash shuffle和sort shuffle区别3.文件少了什么会快?4.hash连接和join连接区别5.spark streaming和flink区别6.对NLP处理技术的了解7.讲一下什么是降维8.一个简历怎么变为一个向量9.编码器的输出是啥10.编码器和解码器为什么不同?11.编码器为什么不能生成12.GBDT讲一下13.它的目标函数咋设计的14.GBDT每个决策树拟合的目标是啥,为什么不能用一颗决策树。
查看13道真题和解析
0
点赞
评论
收藏
分享
02-15 12:11
南方科技大学 数据仓库
万兴科技数开实习一面
1.具体计算了什么指标2.表的粒度3.数据倾斜4.MR5.hive的join方法6.为什么要分为map阶段和reduce阶段7.MR的思想来源,论文有看过吗8.JAVA集合的结构9.JAVA垃圾回收机制10.Python有哪些数据类型?11.列表推导式12.连续7天登录(两种方法实现、不用开窗函数实现)
0
点赞
评论
收藏
分享
02-15 11:59
南方科技大学 数据仓库
TapTap数开实习二面
1.自己讲一个大数据框架2.自学数开中印象最深刻的是什么3.简要总结一下spark和mr区别4.举一个指标开发的讲(主要讲业务价值)4.你的优缺点是啥5.是怎么学习的6.为什么选数开和游戏行业?有些问题不记得了,但都是比较宽泛的问题
查看7道真题和解析
0
点赞
评论
收藏
分享
02-15 11:53
南方科技大学 数据仓库
TapTap数开实习一面
1.介绍项目中的指标搭建2.讲一下简历上的map join,两阶段聚合3.count(distinct)可以用加随机数的方法解决数据倾斜吗4.说一下MR 5.MR的shuffle一定要快排吗6. spark的shuffle和MR的区别7.哪些时候不需要快排?8.讲一下实时项目9.说一下flink了解多少10.checkpoint不是已经可以实现精确一次消费了吗?
查看10道真题和解析
0
点赞
评论
收藏
分享
02-06 15:36
南方科技大学 数据仓库
大智慧数开
岗位名叫数据开发,实则是后端开发。面试官反复确认岗位是否符合预期😅1.你熟悉的语言的话是 Java 和 Python,对吧?那你那你对于 Java, Python 的那个多线程了解吗?2.Python 多线程效率的瓶颈。3.如何将一个我们逻辑上的多线程,然后是映射到物理多线程上面去,然后让,让 CPU 去执行的。4.你有了解过 Java 中的反射机制吗?5.说一下 Java,如果我们用 Java 去读文件的话,或者说用 Python 去读文件的话,我们是一个什么样的步骤?6.常见排序算法7.现在有 10 个 g 的数据,然后我们只有一个 g 的内存,那么我那我如何对这进行排序呢?8.说一下索引9.说一下flinkcdc10.说一下flink checkpoint和savepoint11.cookie和session,JET
查看11道真题和解析
0
点赞
评论
收藏
分享
02-05 17:40
南方科技大学 数据仓库
唯品会大数据开发二面
1.hadoop组成2.讲一下spark on yarn提交流程3.spark宽窄依赖怎么划分4.spark为什么会存在shuffle5.说一下spark on Yarn两种运行模式:Cluster,client模式6.怎么避免死锁7.一个生产线程,一个处理线程,在服务需要退出的时候,怎么确保所有事件处理完了8.CPU消耗很高怎么排查9.接到一个需求怎么做?10.HQL优化详细讲一下11.数据倾斜是怎么发现的
查看11道真题和解析
0
点赞
评论
收藏
分享
02-05 17:39
南方科技大学 数据仓库
唯品会大数据开发一面
1.spark架构2.写spark sql的时候会考虑什么3.hdfs架构4.小文件问题的解决5.yarn架构6.怎么看待资源调度框架,资源调度一般要考虑什么7.Yarn队列8.进程和线程9.CPU调度方法10.spark源码看过吗
查看10道真题和解析
0
点赞
评论
收藏
分享
02-05 17:38
南方科技大学 数据仓库
莉莉丝数开实习
1.主库和备库数据突然对不上了,怎么做2.你们数据存在哪里,mongo和mysql区别3.你对埋点有什么了解?4.以王者为例,设计全新的埋点,分析指标5.给你模糊指标,你怎么去设计数仓6.你这个有几层7.为什么维表要在DWS层8.用什么库进行的开发9.BI展示用的啥10.遇到过跑不动的情况吗?11.开发中写过最复杂的SQL12.数据出现问题,怎么去定位这个问题13.怎么指定你的数据是错的14.你是怎么在开发中保证数据的一致性和完整性的15.会做一些报警吗?16.调度工具是啥17说一下MR18.三道SQL题目,一个登入表,一个登出表,怎么关联,怎么计算累积三小时人数19.工作中有冲突怎么办20.有很多需求你怎么办21.策划一直调整需求怎么办22.为什么选择游戏行业
查看22道真题和解析
0
点赞
评论
收藏
分享
02-05 17:37
南方科技大学 数据仓库
美团数开实习面经
1.看你本硕都是计算机,计算机网络这块应该学过吧,能描述一下http请求的整个过程吗?2.http的状态码有什么3.数据库三范式4.说一下innodb的索引数据结构5.为啥b+树速度快6.mapreduce流程7.hive的排序区别(order by sort by partition by)8.什么是维度建模9.项目里面活动表的表结构是啥?10.sql每日阅读次数超过2的人 11.链表重新排列
查看11道真题和解析
0
点赞
评论
收藏
分享
02-05 17:35
南方科技大学 数据仓库
上海AI Lab数开实习生面经
1.SQl 给一个员工表和部门表,求出部门工资前三员工 2.用迭代和递归分别实现斐波那契(还有输入检查) 3.迭代比起递归的优点 4.算法题:双指针 5.数仓分层和建模过程 6.er模型和维度模型的选择 7.项目经历8.spark用的多吗
查看8道真题和解析
0
点赞
评论
收藏
分享
南方科技大学 数据仓库
@sagima:
【技能进阶5】刷题不是越多越好,首先要学会套公式
0
点赞
评论
收藏
分享
1
创作者周榜
更多
关注他的用户也关注了:
牛客网
牛客企业服务