首页
题库
面试
求职
学习
竞赛
More+
所有博客
搜索面经/职位/试题/公司
搜索
我要招人
去企业版
登录 / 注册
首页
>
试题广场
>
有一个1G大小的一个文件,里面每一行是一个词,词的大小不超过
[问答题]
有一个1G大小的一个文件,里面每一行是一个词,词的大小不超过16字节,内存限制大小是1M,要求返回频数最高的100个词
查看答案及解析
添加笔记
求解答(0)
邀请回答
收藏(19)
分享
纠错
2个回答
添加回答
1
铁离子
如果一个词的出现次数超过了1MB大小,比如某个词出现了2^17次,总次数乘以单词大小2^4为2MB,那这个词再怎么hash取余也会放到同一个文件里分不开,这种情况怎么办
发表于 2022-03-08 17:56:13
回复(0)
1
pein531
先用hash进行分文件,每个文件不超过1M,对每个文件进行wordcount,最后再对结果文件进行汇总,得到词频最高的top100
发表于 2021-01-14 10:06:14
回复(0)
这道题你会答吗?花几分钟告诉大家答案吧!
提交观点
问题信息
阅文集团
2021
大数据开发工程师
来自:
2023届阅文大数据方...
上传者:
小小
难度:
2条回答
19收藏
1713浏览
热门推荐
相关试题
五月份的商品销售额为60万元,该月...
数据分析师
途虎
2021
评论
(2)
来自
途虎养车2023秋招数据...
字符串全排列
Java工程师
C++工程师
iOS工程师
安卓工程师
运维工程师
前端工程师
算法工程师
PHP工程师
测试工程师
安全工程师
c#工程师
数据库工程师
大数据开发工程师
瓜子二手车
2019
评论
(29)
合并二叉树
Java工程师
C++工程师
iOS工程师
安卓工程师
运维工程师
前端工程师
算法工程师
PHP工程师
测试工程师
安全工程师
c#工程师
数据库工程师
大数据开发工程师
瓜子二手车
2019
评论
(7)
红袖APP付费记录中间表u_wsd...
大数据开发工程师
阅文集团
2021
评论
(3)
来自
2023届阅文大数据方向笔试卷
某种产品中,合格品率为0.96.一...
大数据开发工程师
阅文集团
2021
评论
(2)
来自
2023届阅文大数据方向笔试卷
扫描二维码,关注牛客网
意见反馈
下载牛客APP,随时随地刷题