首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
在线笔面试、雇主品牌宣传
登录
/
注册
多菜啊才这纠结半天?
2019-07-12 14:37
已编辑
门头沟学院 C++
关注
已关注
取消关注
问一道题,面试遇到的,不会
说的是有一亿条数据(假设里面是数字),让我找出里面最大的五个数,我该怎么找,这些数据存在文件里,一行存一个。都不知道要考啥…我就说了一个一个读出来,再记录最大的五个数.答案肯定不是这个,不过确实不知道该往什么方向想,有带哥解答一下吗?感谢
#题解#
提示
全部评论
推荐
最新
楼层
刘文涛123
快手_国际化服务端架构开发_Java开发工程师
先问一亿条数据是否存在一个文件,如果是的话,就顺序读取,建立一个有5个元素的小根堆,没读取一个元素就和小根堆顶作比较,如果比小根堆顶小就继续读取,如果比小根堆定大,就替换小根堆顶元素,并且重新构建根堆,直到全部读取完。 如果存在几个文件中,则几个文件同时按照上述步骤进行,然后将所有小跟堆的数据整合,在从新进行小根堆操作。
点赞
回复
分享
发布于 2019-07-12 14:42
呆小木
西安交通大学 数据分析师
这种题目一般有内存限制,思想就是分治。有两种方法,一种就是利用哈希把大文件拆分成若干个小文件,每个小文件都在内存限制范围之内,依次读入内存,配合小顶堆,就能找出最小的n个数。另外一种就是使用分布式集群,利用哈希把大文件映射到多台节点上,每台机器分别计算,最后汇总
点赞
回复
分享
发布于 2019-07-12 15:03
纯情艳阳天
浙江大学 Java
用大小为5的小顶堆
点赞
回复
分享
发布于 2019-07-12 14:40
你午睡了么🔯
北京邮电大学 Java
topn 大顶堆?
点赞
回复
分享
发布于 2019-07-12 14:40
躺平大仙DiamondJ
南昌大学 Java
用mapreduce读?不太懂,等大神回答
点赞
回复
分享
发布于 2019-07-12 14:44
多菜啊才这纠结半天?
楼主
门头沟学院 C++
感谢牛友热心解答😁
点赞
回复
分享
发布于 2019-07-12 14:50
七彩祥云吞天
京东_数据开发
分布式读取 哈哈
点赞
回复
分享
发布于 2019-07-12 14:51
NowaCoder
阿里巴巴_阿里云_研发工程师
堆堆堆
点赞
回复
分享
发布于 2019-07-12 14:52
池里游啊游
北京青年政治学院 Java
大顶堆或者把这些数据分成1000份,每份里面取最大的5个。然后再把取出来的50000个数据里面取最大的五个。这样内存就存的下了。
点赞
回复
分享
发布于 2019-07-12 15:03
Leal.
The University of Sydney 大数据开发工程师
应该可以用 mapreduce或者 spark吧。就是topN的问题,可以用小顶堆
点赞
回复
分享
发布于 2019-07-12 15:09
后端打杂人员
中国科学技术大学 C++
5只是个虚数,问题关键应该还是经典的TopK问题,5个元素的话用堆说实话不比数组有优势,1000个,10000个就差别明显了。
点赞
回复
分享
发布于 2019-07-12 17:19
ssezhangpeng
百度_AIG_后台开发
局部淘汰法
点赞
回复
分享
发布于 2019-07-12 21:49
还没有回复哦~
相关推荐
02-26 16:24
已编辑
北京外国语大学 平台产品
怎么实习,含金量最高?
上一篇写了关于如何屏蔽外界干扰,、专心实习,没想到阅读这么好,感谢大家的喜爱和认可。最近实习的同学比较多,我们公司,包括我身边的学弟学妹们也有很多开始实习了。但我听到很多实习生都吐槽自己做的是dirty work,不太清楚具体有多dirty,但一般实习生顶多执行向的琐事比较多,不至于有啥脏活累活(如果每天干的是点外卖、打印文件就当我没说)但执行侧的琐事也是能干出含金量的,核心取决于你怎么干。我结合我自己之前的实习经历,包括这几年我带实习生的经历,跟大家分享一些我个人的经验。1、理解你的工作/业务/项目背景信息不开玩笑,很多人实习了好几段,甚至很多正职水货,都没弄清楚自己在做什么。这里的做什么,...
职场上哪些行为很加分?
点赞
评论
收藏
分享
02-23 11:51
Shopee_QA
【虾皮/Shopee】2022届同学3周年工作感想
本文延续自旧文“【虾皮/Shopee】2022届同学试用期感想”。仅供参考,严禁转载。前一阵收到了自己3周年的弹窗提示,意识到自己已经在虾皮工作三年了,在这里记录一下。大概率这也是我个人分享的最后一篇文章,代表着我对牛客网最后的回馈。2021年,我在牛客网的各种面经参考下,以提前批的方式参加了虾皮的2022届招聘,并成功获得了offer,也在最后进入了这家公司,一来就是3年,现在仍然在里面打工。当然,面对持续降本增效的社会风范,主动或被迫离开公司是迟早的事情。3年的工作,让我从校园生活过度到社会生活,过程还是比较平滑,看待事物的态度也逐渐发生了变化。学校里面的“做题解题”思路大多情况不适用于社...
虾皮信息成长空间 261人发布
我的岗位说明书
如果再来一次,你还会选择这个工作吗?
点赞
评论
收藏
分享
02-19 10:01
广州理工学院 Java
25 届还有活路吗
徐新高:
号已经废了 建议重开一个账号投简历
点赞
评论
收藏
分享
昨天 15:17
浙江财经大学 平台产品
我真是笑发财了
摸鱼的时候看看牛客,大家可真是太有创意了哈哈哈哈哈哈,一个字:绝!
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
19
分享
评论
提到的真题
返回内容
招聘动态
查看更多
叠纸游戏
2025届校园招聘
米哈游
2025春季校园招聘
26届实习网申合集点就送~
25年薪资合集点击领取!
京东 TET管培生
全站热榜
更多
1
...
实习怎么偷产出?
2.5W
2
...
怎么实习,含金量最高?
1.2W
3
...
有奖征文:职场上哪些行为很加分?投稿得丰厚奖励!
1.2W
4
...
面试大厂反拷打指南(字节&腾讯)
1.2W
5
...
字节春招前端一面二面凉经
8520
6
...
字节生活服务后端开发日常实习一二三面经
8344
7
...
字节跳动 二面凉经
7245
8
...
工科双非一定要读研
5392
9
...
搬出当年写的22考研经验贴哈哈
4988
10
...
明知道自己考不上研,还要坚持吗?
4963
创作者周榜
更多
正在热议
更多
#
如何KTV领导
#
33179次浏览
287人参与
#
你投递的公司有几家约面了?
#
39553次浏览
238人参与
#
掌阅春招
#
89831次浏览
524人参与
#
研究所笔面经互助
#
55338次浏览
395人参与
#
软开人,秋招你打算投哪些公司呢
#
67530次浏览
727人参与
#
vivo求职进展汇总
#
168177次浏览
1022人参与
#
生物制药/化工校招攻略
#
33993次浏览
265人参与
#
你遇到过哪些神仙同事
#
45785次浏览
471人参与
#
当下环境,你会继续卷互联网,还是看其他行业机会
#
73587次浏览
546人参与
#
硬件/芯片公司工作体验
#
58754次浏览
560人参与
#
如何缓解入职前的焦虑
#
142236次浏览
1129人参与
#
TP-LINK工作体验
#
38727次浏览
787人参与
#
Tplink求职进展汇总
#
102541次浏览
570人参与
#
在职场上,你最讨厌什么样的同事
#
10850次浏览
139人参与
#
你最近一次加班是什么时候?
#
32406次浏览
252人参与
#
考研人,我有话说
#
17926次浏览
347人参与
#
软件开发春招备战日记
#
58226次浏览
501人参与
#
秋招白月光
#
53460次浏览
788人参与
#
产品每日一题
#
29319次浏览
412人参与
#
过年最难忘的一件事
#
10991次浏览
155人参与
#
你今年的平均薪资是多少?
#
94580次浏览
462人参与
牛客网
牛客企业服务