首页 / 大数据开发
#

大数据开发

#
129336次浏览 2985人互动
此刻你想和大家分享什么
热门 最新
小米大数据一面
1.自我介绍2.熟悉flink还是spark答:flink3.介绍下flink架构吧答:这里越深越好,我就讲到了flink的jobmanager(dispathcer,jobmaster)和taskmanager4.flink有哪些算子?答:map,flatmap,filter,window,union等,RichFunction提供生命周期open close,上下文环境。5.flink你知道有哪些窗口吗?计数窗口能介绍下吗?答:时间窗口有滚动滑动会话,计数窗口有滚动滑动。6.你知道窗口什么时候触发吗?答:讲了一下窗口触发器trigger7.你能介绍下flink有几种窗口触发器吗?底层怎么实现的。答:讲了一下事件时间触发器和处理时间触发器的原理。8.假如flink窗口突然不触发了,你怎么排查。答:这里我答了一下排查上游其中一个流是否断流,如果其中一条流断流可以设置withIdleness空闲时间,让窗口的最小水位线机制去掉那个断流的依赖,靠另外的流触发计算。这里面试官提了一个场景,如果小米商城半夜就是没人买东西或者数据量很小导致水位线不能及时更新,(就是每条流都没数据)那你该怎么触发呢?利用窗口触发器ProcessingTimeoutTrigger 9.口述一道sparksql题10.sparksql优化答:(1)sort by 代替 order by,需要结合distribute by使用。(2)count(distinct)优化(3)列裁剪(4)谓词下推(5)优化MAPJOIN阈值。(6)定期合并小文件,防止maptask数量过多(7)多用explain看执行计划,避免笛卡尔积等意外情况11.执行计划怎么看每个stage是根据shuffle切分,执行计划会写上具体的操作符和数据量和JOIN规则。12.distrubute by 会发生shuffle吗?根据什么字段distribute by? 这个和cluster by的区别是什么?13.反问:(1)小米数仓具体是做什么数据?(2)为什么岗位介绍上写了机器学习?面试官说这个有专门团队去做,跟数仓关系不大牛客字数限制,答案写的有点简略小米面试官的技术感觉很强,态度好,体验很不错,希望以后有机会能进吧。#大数据开发#
kathyr_:八股轰炸啊,佬这个是春招还是实习
小米一面336人在聊 查看10道真题和解析
点赞 评论 收藏
分享
携程数开凉面(三面已挂)
点赞 评论 收藏
分享
4.04美团-暑假实习-大数据一面
面试时间:1h 10min自我介绍实习工作的一些问题项目相关的一些问题Java基本数据类型?String为什么不是基本数据类型?能不能继承?如果需要频繁地拼接字符串用什么?为什么?StringBuffer、StringBuilder 的区别?Java的集合类了解吗?都有那些?它们的继承关系是怎么的?讲讲HashMap?HashMap多线程下怎么办?多线程的HashMap它的原理?并发编程的问题,听的有点懵,说不会,他又换了一个,还是不会,尴尬JVM内存结构?类加载机制?线程池了解吗?介绍一下设计模型用过那些?在哪里用过?线程和进程的区别?我看你学过python,python里面的协程和进程线程有什么区别吗?MapReduce原理?Spark为什么比MaReduce快?现在还有用MapReduce的吗?比起Spark,MapReduce的应用场景?Spark任务执行的流程?宽窄依赖?HDFS是如何保证数据可靠的?机房断网,造成脑裂怎么办?Flume构成?你在项目里是怎么用的?Kafka的构成?多个partition,怎么能保证全局有序?回答可以设置一个partition,不知道其他方法,反问面试官。他说这是别人问他的,他也不知道,问问看我能不能知道....数据库和数据仓库区别?数仓为什么要分层?星型模型和雪花模型区别?维度表和事实表,介绍一下?SQL:给了一张用户登陆表,求每个日期用户的活跃数、7日留存用户、7日活跃留存率好像最后时间不够了,我还没写完,就让我说了一下思路反问:部门业务是什么实习生都做什么工作对实习生有什么要求总结:- 问了很多项目相关的问题,很细,我开始以为一面只会问八股,没怎么准备,猝不及防- 面试官说他不是这个部门的,似乎是后端开发的,问了不少Java 的八股,Java集合的内容很久没复习,忘得差不多了;并发编程是都没研究过- 第一次面试,有些紧张,NameNode和DateNode、线程和进程 这些嘴瓢都说乱了,面试官人挺好的,还在安慰我别紧张#我的实习求职记录##美团##大数据开发#
投递美团等公司10个岗位 大数据求职圈
点赞 评论 收藏
分享
2024年5月 数据开发投递总结
记录一下暑期实习投递历程 5月17号开始投递 因为之前在脉脉实习 一直推到5月才开始找 基本上暑期实习都快截止了 投了很多 也都没有回信。每天都盯着boss 官网 牛客 实习s 不管三七二十一 都投了  终于零碎约到几家日常实习面试【shein 希音】一面:聊实习 基本上都是我在讲 。把实习的工作内容 都给他讲了一遍(不是很感兴趣)。八股: 内部表和外部表区别 缓慢变化纬然后问我实习多长时间 工作地点深圳 能不能接受没约二面 感觉挂了【电信—天翼安全】一面: 聊实习 说了好久。然后 问了几个简单的八股 介绍一下spark  内部表和外部表区别 对实时感兴趣吗。 面试官说 很缺人 ,转正很容易。最后发offer了【大疆】一面(25分钟) :聊实习 面试官比较感兴趣 聊了好久 口述一道sql 连续登录 三种解法二面(10分钟) : 纯聊天 我实习的内容和下面要做的很像 面试官想让我去最后发offer了 【百度】一面:聊实习 然后问了两个很基础的八股 出了一道sql 比较简单 算法题入门dp  左上角到右下角路径的种类二面 面试官 很牛 一上来就探讨Hadoop切片问题 聊了十分钟 尬了五分钟 (完全不会)出了一道sql比较简单 算法题 验证IPV4和IPV6 没写出来最后挂了【美团】一面 聊了一下实习 按照简历问的八股 面试官什么都问了 学的课程也问了 八股问的spark相关 为什么要有DAG图 为什么要划分阶段  然后出了一道算法题 验证二叉搜索树二面 聊了一下实习 还有简单的spark八股 最后发offer了 #大数据开发#
牛客663398484号:大疆实习生基本晚上十点才能走😂😂😂
查看3道真题和解析
点赞 评论 收藏
分享
玩命加载中
牛客网
牛客企业服务