大数据之排序问题求解

一个4T的存放url的文件,机器内存4G,怎么对url按字典序排序
全部评论
4T = 4 * 1024G 计算url的hash值,然后将hash值对1024取模,也就是把4T的文件划分为1024个大小为1g左右的文件。 内存有4g,所有可以对1g的小文件全部放入内存进行排序,待1024个文件都排完序之后,多路归并。
点赞 回复 分享
发布于 2017-09-19 17:22
基数排序?
点赞 回复 分享
发布于 2017-09-19 16:40
归并排序
点赞 回复 分享
发布于 2017-09-19 17:15

相关推荐

评论
点赞
8
分享
牛客网
牛客企业服务