大数据实习面试记录

#数据人的面试交流地#
十方融海 大数据开发实习生(秋招提前批)
一面:2022/05/30
自我介绍
this super  
值和引用
垃圾回收算法    
多线程用过吗  
回收算法  进程线程  
Linux子系统:
linux内核的子系统有5个:
        1、 进程调度控制系统(SCHED);
        2、内存管理系统(MM),主要作用是控制多个进程安全地共享主内存区域;
        3、虚拟文件系统(VFS);
        4、网络接口(NET);
        5、进程间通信(IPC)。
hadoop架构
项目流程
网络七层
冒泡排序的时间复杂度
prim算法
索引种类 和 类型
开启一个mr分配多少内存
反问

二面:2022/05/30
自我介绍
索引页的实现
一亿数据在b+有多少页,多少层
一亿数据的id,怎么随机找到一个id 答:bitmap hash
一亿数据的top100
索引种类
为什么用B+树
上传小文件到hdfs上,计算机网络、操作系统的流程
mr join的流程
Linux内存不够怎么查看     查看物理内存使用情况 free -m (总 已使用 剩余)
total:总计物理内存的大小
used:已使用多大
free:可用有多少
Shared:多个进程共享的内存总额
Buffers/cached:磁盘缓存的大小
Linux运行情况
linux buffer和cache
平衡二叉树的时间复杂度,怎么推导
hbase
大数据相关职业的了解
反问
全部评论

相关推荐

11-04 14:10
东南大学 Java
_可乐多加冰_:去市公司包卖卡的
点赞 评论 收藏
分享
点赞 评论 收藏
分享
点赞 2 评论
分享
牛客网
牛客企业服务