数分简历求拷打

全部评论
数分没实习就别想了
点赞 回复 分享
发布于 09-18 16:35 江苏

相关推荐

各位大佬,后辈目前研1,专业是金融科技,本科学的是应用统计跟应用数学,求职方向是数分,有两端数分实习,一段是上市快消公司的一段是电子产品领域的跨境电商公司因为数分现在实在太卷了,加上之前面试数分实习的时候,罕见的遇到了不止一家公司问是否有数仓使用经验,都以我沉默答不上而宣告失败。痛定思痛后我决定补充数仓知识同时把数仓作为并行求职路线本科的时候接触过python,sql,实习也干过写sql,做报表,Bi可视化,写python数据处理脚本这些工作内容,但是没有大数据组件使用经历。从九月开始跟网课学,现在学了hadoop,hive,spark三个大组件,还有zookeeper和kafka,现在正在做一个离线数仓项目(hive + pyspark)想请教一下大佬们有人也是应用统计转数仓的吗?这样做前景如何?以及目前我预计下周五之前做完项目,做完项目之后应该做哪些准备呢,是直接开始背大数据组件的相关八股?如果不找实时岗位,flink一定要学吗?另外,我咨询过不同的信息渠道,有些前辈说大数据可以用python解决,有些前辈说还是得学java,请问有前辈可以就这个问题答疑解惑吗?面试的时候,八股文部分考核,是聚焦大数据组件的八股,还是也会出现计算机网络,操作系统这些计算机专业科班才会接触的内容呢(如果是后者那恐怕应统专业是要跟大数据无缘了)#数据人的面试交流地##牛客在线求职答疑中心##你后悔选择现在的专业吗#
Markovo:不投实时可以不用学flink,数仓就是写hql,java都很少用到
点赞 评论 收藏
分享
-- 我的论文相关、spark1、网格怎么划分的2、基于spark做的吗,使用了哪些算子?这个转换类的:map、flatmap、mapPartitions、filter、reduceByKeyaction: reduce、collect、count(eg分发到各个节点网格数目统计)3、spark有哪些组件?组件之间怎么进行数据联通的?回答了,master、DAG生成、依赖关系、worker等等。答得不是很好4、yarn资源管理的工作机制(简历自己写的给忘了)5、yarn那些resouce manager、node manager 、application master、container角色?他们之间什么关系?每一个组件起的什么作用?6、spark有哪些shuffle?什么场景下用哪些shuffle?回答的hash shuffle和sort based shuffle。主要是中间文件太多。好像偏题了7、spark中出现数据倾斜,怎么解决?背的这个 https://blog.csdn.net/Aaron_ch/article/details/122224043两阶段聚合没说清楚。-- sql1、班级表、学生表;统计每个班级的平均分不需要考虑班级表left join学生表,只考虑学生表即可,班级表是一个迷惑条件。我中间意识到好像不用班级表,但是有一个班级名称重复的情况,面试官赞同了。面试官很好,还跟我讲了一下班级表是没用的。-- java基础1、线程安全保证的方式。答的四种关键字修饰 synchronized、volatile、atomic、final2、讲一下synchronized和volatile区别。没答上3、共享屏幕写一下synchronized单例模式。4、final、finally、finalize区别。只说了final修饰的变量必须初始化,后面不能被赋值;其他没打上来┭┮﹏┭┮,java基础忘背了。。。5、java线程池是什么,有哪些优势?没答上6、java8的lambda表达式是什么,说明一下优点、应用场景只回答了lambda匿名函数,方便...
点赞 评论 收藏
分享
点赞 收藏 评论
分享
牛客网
牛客企业服务