问一道题,面试遇到的,不会

说的是有一亿条数据(假设里面是数字),让我找出里面最大的五个数,我该怎么找,这些数据存在文件里,一行存一个。都不知道要考啥…我就说了一个一个读出来,再记录最大的五个数.答案肯定不是这个,不过确实不知道该往什么方向想,有带哥解答一下吗?感谢#题解#
全部评论
先问一亿条数据是否存在一个文件,如果是的话,就顺序读取,建立一个有5个元素的小根堆,没读取一个元素就和小根堆顶作比较,如果比小根堆顶小就继续读取,如果比小根堆定大,就替换小根堆顶元素,并且重新构建根堆,直到全部读取完。 如果存在几个文件中,则几个文件同时按照上述步骤进行,然后将所有小跟堆的数据整合,在从新进行小根堆操作。
点赞 回复 分享
发布于 2019-07-12 14:42
这种题目一般有内存限制,思想就是分治。有两种方法,一种就是利用哈希把大文件拆分成若干个小文件,每个小文件都在内存限制范围之内,依次读入内存,配合小顶堆,就能找出最小的n个数。另外一种就是使用分布式集群,利用哈希把大文件映射到多台节点上,每台机器分别计算,最后汇总
点赞 回复 分享
发布于 2019-07-12 15:03
用大小为5的小顶堆
点赞 回复 分享
发布于 2019-07-12 14:40
topn 大顶堆?
点赞 回复 分享
发布于 2019-07-12 14:40
用mapreduce读?不太懂,等大神回答
点赞 回复 分享
发布于 2019-07-12 14:44
感谢牛友热心解答😁
点赞 回复 分享
发布于 2019-07-12 14:50
分布式读取 哈哈
点赞 回复 分享
发布于 2019-07-12 14:51
堆堆堆
点赞 回复 分享
发布于 2019-07-12 14:52
大顶堆或者把这些数据分成1000份,每份里面取最大的5个。然后再把取出来的50000个数据里面取最大的五个。这样内存就存的下了。
点赞 回复 分享
发布于 2019-07-12 15:03
应该可以用 mapreduce或者 spark吧。就是topN的问题,可以用小顶堆
点赞 回复 分享
发布于 2019-07-12 15:09
5只是个虚数,问题关键应该还是经典的TopK问题,5个元素的话用堆说实话不比数组有优势,1000个,10000个就差别明显了。
点赞 回复 分享
发布于 2019-07-12 17:19
局部淘汰法
点赞 回复 分享
发布于 2019-07-12 21:49

相关推荐

粗心的雪碧不放弃:纯学历问题,我这几个月也是一直优化自己的简历,后来发现优化到我自己都觉得牛逼的时候,发现面试数量也没有提升,真就纯学历问题
点赞 评论 收藏
分享
牛客717484937号:双飞硕没实习挺要命的
点赞 评论 收藏
分享
评论
点赞
19
分享
正在热议
# 25届秋招总结 #
440279次浏览 4490人参与
# 春招别灰心,我们一人来一句鼓励 #
41427次浏览 524人参与
# 北方华创开奖 #
107277次浏览 599人参与
# 地方国企笔面经互助 #
7922次浏览 18人参与
# 虾皮求职进展汇总 #
113889次浏览 883人参与
# 实习,投递多份简历没人回复怎么办 #
2453837次浏览 34847人参与
# 阿里云管培生offer #
119749次浏览 2219人参与
# 实习必须要去大厂吗? #
55644次浏览 960人参与
# 同bg的你秋招战况如何? #
75364次浏览 551人参与
# 提前批简历挂麻了怎么办 #
149798次浏览 1977人参与
# 投递实习岗位前的准备 #
1195641次浏览 18546人参与
# 你投递的公司有几家约面了? #
33170次浏览 188人参与
# 双非本科求职如何逆袭 #
661833次浏览 7394人参与
# 机械人春招想让哪家公司来捞你? #
157595次浏览 2267人参与
# 如果公司给你放一天假,你会怎么度过? #
4719次浏览 54人参与
# 如果你有一天可以担任公司的CEO,你会做哪三件事? #
11300次浏览 267人参与
# 发工资后,你做的第一件事是什么 #
12384次浏览 61人参与
# 工作中,努力重要还是选择重要? #
35576次浏览 384人参与
# 参加完秋招的机械人,还参加春招吗? #
20079次浏览 240人参与
# 实习想申请秋招offer,能不能argue薪资 #
39220次浏览 314人参与
# 我的上岸简历长这样 #
451897次浏览 8088人参与
# 非技术岗是怎么找实习的 #
155837次浏览 2120人参与
牛客网
牛客企业服务