京东数据分析实习面经7.29
1、挑了一个简历里的项目,介绍自己简历里的项目
2、针对简历问了pandas的用法
3、mapreduce里的map和reduce什么区别?
reduce为累计器,reduce虽然可以用来处理数据结构并进行数据结构的重组,但是规范来讲,一般不采取这样的做法,通常只是用reduce进行累计计算,返回一个对象或数值型的累积结果
map为迭代器,通常用于处理数据结构的所有数据,并进行数据结构的重构
4、Hive 的数据都是存储在哪? HDFS
5、python里的字典是哪种数据结构?
字典又称为哈希表(hashmap)、映射(map),它是以key-value的方式进行存储,通过key进行存储、查找操作的效率非常高。
6、数据库里的索引有什么用?
索引是对数据库表中一列或多列的值进行排序的一种结构,使用索引可快速访问数据库表中的特定信息。如果想按特定职员的姓来查找他或她,则与在表中搜索所有的行相比,索引有助于更快地获取信息。
7、java的继承怎么写的?
class Student extends Person
8、描述一下泊松分布。
9、正态分布的公式需要哪些量?方差和均值
10、python读取json用法?(这个是我项目里的)
11、JOIN、LEFT JOIN、Right JOIN、Inner JOIN的区别
https://blog.csdn.net/qq_44756792/article/details/95503303
https://blog.csdn.net/ly294687451/article/details/88251761?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.channel_param&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.channel_param