美团数据开发面经

秋招结束咯~写写之前的面经攒人品~

自我介绍
为什么选数据开发,对数据开发的理解。
HDFS的读写机制
什么是数仓(不是只有结构化
如果副本机制只有2,会有什么优点和危害?
spark的计算都是在内存里吗
项目中怎么进行数据清洗

数据库的主键、唯一、外键索引
(主键索引是唯一索引的一种,一个表中可以有多个唯一索引但只能有一个主键,主键列不能有空值,而唯一索引允许空值,主键可以作为其他表的外键)
如果有大量客户注册,应该怎么优化数据库?
Python的进程,线程和协程
(进程是资源分配和调度的基本单位,有自己的独立空间,开销大;线程是CPU调度的基本单位,进程的实体;协程是用户态的轻量级线程,单线程内执行多任务;切换效率:协程>线程>进程)
Python的复制,浅拷贝,深拷贝
(浅拷贝只拷贝最外层,深拷贝拷贝所有完全独立。当原始对象的最外层改变时,两者都不变;当原始对象的子对象改变时,浅拷贝随之变化。修改浅拷贝的子对象会影响原始对象,但深拷贝不会。)
学习大数据的时候遇到的一些难点
手撕:链表反转,积分最高sql

反问:需要做的主要工作,工作氛围,工作地点
全部评论

相关推荐

2 7 评论
分享
牛客网
牛客企业服务