大华大数据开发面经

大华一面:
1.实习的过程中有没有什么编码情况?

2.问做过什么项目?

3.在etl项目中具体做了什么?

4.项目中的mr是怎么写的?

5.reduce的规则是什么?

6.java的反射和动态代理的原理?

7.String,StringBuffer,StringBuilder的主要区别?

8.JVM的内存划分,以及每个都是干什么用的?

9.栈溢出会报什么错误?

10.线程池?

11.ConcurentHashMap高效的线程安全的实现?

12.是怎么分段的?

13.自旋锁,偏向锁,可重入锁,轻量级锁?

14.sparing,springboot,等开发框架有了解吗?

15.知道哪些设计模式设计模式?

16.生产者消费者模式是用在哪个场景下,是怎么使用的?

17.网络的优先控制机制?
消息怎么样快速发送,和达到上限怎么抑制,以什么样的方式判断消息量 ,滑动窗口等...

18.http的长链接和短连接?

19.加入现在有几亿个整数,只有一个数和其他的数是不同的,怎么找出这个不同的数?

20.乐观锁和悲观锁?

21.mr的基本原理?

22.map如何决定它是进入哪个reduce的?

途牛一面:
1.hdfs是通过哪个中间件去存储数据的?

2.结合wordcount述说mapreduce?

4.hdfs读写数据?

5.namenode返回元数据?

6.mapreduce数据倾斜产生的原因以及如何解决?

7.spark会不会,没问?

8.hive的内部表和外部表,为什么内部表的删除,就会将数据全部删除,而外部表只删除表结构?

9.为什么用外部表更好?

10.left join和inner join ,right join的区别?

11.几个sql很简单,left join

如何获取A表中有,B表中没有的记录

12.统计函数,max,min,avg有三个人,几门课的成绩,求平均成绩?

13.hive的UDF实现过程,UDTF,UDAT?

14.hives使用udf函数,要将代码上传到服务器,注册函数,才能使用?

15.常见的集合类?

16.ArrayList和LinkedList的区别?

17.为什么LinkedList更适合插入和删除?

18.遍历Hashmap的数据的方式?

19.hashset为什么不能重复?

20.ConcurrentHashMap?实现线程安全是用什么?


21.java的线程池?

22.有new过线程池吗?

途牛二面:
1.问项目

2.mysql和hive的区别?

3.redis原理,redis的存储数据类型?

4.redis一般会有哪些问题?

5.缓存雪崩,怎么去处理,如何设置key分批失效?

6.冒泡和快排的基本思想和时间复杂度?

7.二叉树有什么优点有什么缺点?

8.一个文件中有1000个单词,查询这1000个单词中,字母出现的top10


#面经##校招##数据开发工程师##浙江大华技术股份有限公司#
全部评论
你好,途牛这阵子有招大数据吗?
点赞 回复 分享
发布于 2021-03-10 00:33
问这么多mr是因为写的是hadooo吗,写spark会问这么多吗
点赞 回复 分享
发布于 2021-03-05 22:46
请问楼主你投递的是大华官网11月放出的那个岗位的吗?还是春招新流程的岗位啊?
点赞 回复 分享
发布于 2021-03-05 22:41
你好,请问大华的一面是电话还是视频面试呀?谢谢
点赞 回复 分享
发布于 2021-03-05 13:07

相关推荐

#牛客AI配图神器#上来自我介绍,个人信息、在校所学专业、毕业时间、为什么学习大数据。询问出生年份。(没懂为什么专门问这个)介绍项目,离线数仓的五层是怎么设计的,DataX做首日的全量采集、Maxwell做后续每日的增量采集,Flume传输数据,Kafka起缓存作用,解耦各个组件。大数据竞赛拿了全国一等奖,那么这个竞赛中做的是什么业务?学校主修课是什么,大数据是否是自学?介绍一下简历中的离线数仓。说一下Maxwell的底层实现原理。讲一下Hive On Spark引擎的特点。介绍一下简历中的实时数仓。说一下checkpoint机制和精准一次。Docker的常用命令。Doris需要更新数据吗,怎么更新数据的,是用update吗?Doris在项目中的作用。Kafka的偏移量需要手动维护吗。项目的数据来自哪里,是真实的数据吗?数据量有多少,能达到什么级别,有一亿条数据吗?HBase在项目中是怎么使用的,为什么维表存到HBase中?为什么没有存到Redis中?FastJson了解吗,说一下。SpringBoot的拦截器和过滤器的区别。现在是否在校?反问工作压力大吗?公司有食堂吗?(我在想没食堂 可以买拼好饭吃😋)刚才回答的内容还算可以吗?(面试官:回答得没问题,学生能学到这个程度,已经可以了)写面经攒人品,希望能一把过#数仓面试##数据开发##数仓开发#
查看19道真题和解析
点赞 评论 收藏
分享
03-21 11:17
已编辑
华东理工大学 Java
面试时间:一小时、面试部门:淘宝商品部门1.自我介绍2.研究生阶段的学习方向,比如重点课程之类的,有没有大模型相关的?3.项目拷打(技术选型、数据量、具体场景4.有没有到github了解大数据前沿开源工具场景题:5.分库分表:    电商用户下单场景怎么分比较好?    如果用userID拆,卖家的维度的订单列表怎么查?6.秒杀场景下,如何设计Redis架构有效处理热点数据?7.项目里Redis用到的数据结构?八股:8.讲一下ZSet9.Redis性能快的原因10.还有什么中间件采用IO多路复用11.MySQL的索引设计 B+树12.索引优化策略13.常见/ 特殊类型的索引结构14.现在有一个表,然后有一个主键,这种情况下,如果在主键之外又建了其他的一个联合索引的话,那这个时候有几个索引树?  数据行会存在哪15.用操作系统本质的原理解释为什么JVM编译出的class运行比Native程序慢16.JVM的内存布局17.TLAB有没有了解过?(Thread Local Allocation Buffer 18.Linux常见的黑屏命令行工具19.(给了一个文本) 能不能说出来几个工具,能快速把这些文本里面按照他的响应时间从大到小的排序,同时保留其他字段的信息。反问:技术栈?面试有几轮? 答:应该是三轮技术一轮HR。(面试官以为是春招面试体验不错,虽然很多场景题,但面试官都会耐心引导回答。#软件开发笔面经# #牛客AI配图神器# 3.21 二面 电话面在阿里的代码网站实现一个能够实时处理大量文件,判断文件每行是否含有违禁词的检查器扩展提问:1.如果本地文件比较大 多线程能否处理2.如果文件一直有写入的情况下 如何保证拆分文件的进程不出错3.如果真正要建一个数据库表存储违禁词 如何设计4.用哪一类数据库合适5.如果是分布式部署在集群上 的日志文件 做实时处理 应该用什么方式更好6.有没有大数据领域的解决方法
查看103道真题和解析 软件开发笔面经
点赞 评论 收藏
分享
评论
6
47
分享

创作者周榜

更多
牛客网
牛客企业服务