Mapreduce 的input split就是一个block
input split是一种记录的逻辑划分,而block是对输入数据的物理分割,两者之间有着本质的区别
由于Block是本地的,DFSCline可以不用向DataNode建立连接,直接读磁盘上的文件
为了发挥计算本地化性能,应该尽量使inputSplit大小与block大小相当
这道题你会答吗?花几分钟告诉大家答案吧!
扫描二维码,关注牛客网
下载牛客APP,随时随地刷题