海量数据问题,和一些个人记得问题

百万量级的数据排序:

  • 任意大小:外排序,先将数据拆分到多个文件中,分别加载到内存中排序,然后再归并到一个文件里。实际上就是 LeetCode 23. 合并 k 个有序链表,需要用到最小堆。
  • 范围为 [0, 10000]:计数排序。

百万量级的数据查询在不在:

可以使用位图,前提是数据范围不超过内存大小。

百万量级的数据求 TopK:

数据流的 TopK 问题,维护一个大小为 k 的小根堆,然后分片读入数据,并更新堆。



全部评论

相关推荐

程序员鼠鼠_春招版:都很烂大街,rpc也基本没人问,考研吧,不然就包装一段实习再去
点赞 评论 收藏
分享
明天不下雨了:我靠2022了都去字节了还什么读研我教你****:你好,本人985电子科大在读研一,本科西南大学(211)我在字节跳动实习过。对您的岗位很感兴趣,希望获得一次投递机会。
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客企业服务