牛客678303729 level
获赞
8
粉丝
1
关注
0
看过 TA
2
重庆邮电大学
2022
算法工程师
IP属地:未知
暂未填写个人简介
私信
关注
问,十亿的数据量,每条数据4个字节,如何去重,或者统计每条数据出现的次数; 面试官开始没有说数据量,我回答是,在不考虑空间复杂度的情况下,用集合或哈希表; 面试官后来加入了数据量,和内存不够的条件,我没啥思路,乱答的前缀树做压缩; 这个有什么方法吗?
牛客200478187号:如果只考虑去重、不考虑统计次数的话,可以用布隆过滤器。假设数据量 10^9,失误率 0.1,计算器敲除所需位数换算成内存大小是 571MB,感觉还是有点大。。。没有实操经验,不太懂
投递虾皮信息等公司10个岗位 >
0 点赞 评论 收藏
分享
关注他的用户也关注了:
牛客网
牛客企业服务