时雨66 - 个人主页动态 - 牛客网

发布(4) 评论刷题收藏

03-19 10:46

西安电子科技大学大数据开发工程师

字节跳动实习timeline

投递2.28一面3.5二面3.11hr面3.183.18下午oc#我的OC时间线##字节跳动实习#

我的OC时间线

0 点赞评论收藏

分享

03-10 10:40

已编辑

西安电子科技大学大数据开发工程师

腾讯数据工程一面面经

时间：3月3日1.自我介绍2.说一下熟练到不熟练的技术栈（编程语言和框架）3.spark和hadoop MR两者的区别 ，spark相比hadoop的缺点4.spark内存有500G，数据量有一个T，那spark能不能处理这个数据5.讲讲宽窄依赖、stage怎么划分的6.常用的转换算子和action算子有哪些，reducebykey是action算子吗，和groupbykey有什么区别7.解决数据倾斜的方式 加前缀怎么加8.spark的OOM都是什么原因导致的9.spark的executor内存分成哪几部分 spark.memory.fraction=0.6是控制什么的 10.聊聊广播变量 什么时候广播11.两个sql题，比较简单反问更新 3.7二面挂 回答的不好1.hive的元数据管理2.怎么保证数据一致性3.怎么做数据治理4.怎么把天调度任务做到小时更新 3.10 被捞  晚点更新面经#数据开发工程师面经# #腾讯#

投递腾讯等公司6个岗位

0 点赞评论收藏

分享

2024-12-24 16:02

西安电子科技大学大数据开发工程师

面经｜滴滴数据开发

自我介绍谈谈数仓分层，为什么要分层，分哪些层为什么不直接从ODS层取数怎么划分事实表和维表groupByKey和reduceByKey的区别拷打上段实习，在网易主要做什么工作，遇到最难的业务场景和技术难点是什么写过UDF函数吗 --没写过会哪些语言（回答python）python中的浅拷贝和深拷贝区别 生成器了解吗问目前在哪个城市，后续base会在北京 杭州 上海三选一反问 主要做什么业务 模型的风险评估滴滴的面试还是比较简单的，晚上一面完之后就说会安排二面，结果第三天HR打电话直接OC，看来是很缺人

查看10道真题和解析

0 点赞评论收藏

分享

2024-12-24 15:27

西安电子科技大学大数据开发工程师

网易实习总结--数据开发

实习的部门是 数智事业部 待的小组是一个tob的，面向企业的。所以会出差，用网易的数据平台为企业打造一套数仓包括前端看板实习的主要内容就是：接表。在greenplum数据库的建ODS表，从业务数据库接表，会用到datax给dwd、dws表加字段。配合前端修改任务发布任务、调度任务、配置报警可以看到，属于打杂的，很少接触到业务，但是对于初学者可以了解到数仓的一整个流程，还是可以的。

网易成长空间 168人发布

投递网易等公司6个岗位 >

0 点赞评论收藏

分享

创作者周榜

更多

关注他的用户也关注了：

牛客网
牛客企业服务