大佬们好,我问个八股呗,求解答。

嗯就是那种很大文件的那种的,然后就比如一个大文件然后取中位数啥的,然后还有两个大文件取交集,或者文件去重等等搞得我好懵😂,太菜了哈哈,希望大家能够帮助一下,让我对这些八股能够有很好的应对方法。
全部评论
大文件一般是内存不够,所以需要考虑分而治之,处理一部分或者将流式处理再将结果进行按序的放在磁盘文件中。第一个大文件取中位数,问题在于进行计数,可以先一部分一部分的读,然后计数,然后再从头计数,取对应的中位数,文件去重,可以考虑对文件做hash,然后保存在一个map里,文件不同,hash不同这样来去重
1 回复 分享
发布于 2023-08-04 00:27 四川
昨天面百度,问了200亿个url,10个kv数据库,怎么检索?
1 回复 分享
发布于 2023-08-04 22:00 浙江
俺会了。分而治之。先分,在对每小块进行处理,再合并。基本思路是这些。嗯多搜搜,然后问问chatGPT再就可以了,哈哈。
点赞 回复 分享
发布于 2023-08-04 15:14 河南
我昨天面试被问到 但是面试官就问我 怎么把大文件拆分成小文件在读入呢
点赞 回复 分享
发布于 2023-08-04 17:32 天津
可以用mmap映射读取部分数据吗
点赞 回复 分享
发布于 2023-08-05 00:29 浙江

相关推荐

昨天 18:10
已编辑
门头沟学院 Unity3D客户端
如题,鼠鼠快碎掉了。鼠鼠正在投暑期和日常的实习,可能是因为简历太差吧,好多初筛都没有过,所以其实格外珍惜每一次的约面。尤其鼠鼠是八股选手,但凡碰到喜欢问项目的面试官是直接速通鼠掉。那是一个万里无云的晚上,鼠鼠接到tx某子公司的约面,虽然没算法题但是问得我汗流浃背。面试官从我的八股批判到我的项目继而批判到我的实习,感觉基本上除了八股这种特定答案之外每一个问题都要质问我,尤其是询问到实习的时候我解释完之后直接来了一句“那你实习也啥也没做啊”,鼠鼠直接原地碎掉。之后的问题鼠鼠也不太记得了,大部分都是直接吟诵咒语,肌肉记忆直接不过脑子。因为接二连三的压力鼠鼠直接摆烂了,回答的时候也不太看屏幕直接开始搓...
机器人为什么是猫呀:楼主要自信。好的面试官是会照顾面试者情绪的,不会直接说那么伤人的话。面试表现其实很看自己的心态跟情绪,这些又和面试官的反馈很相关。而且有些面试官很高傲,不求甚解,自认为你的东西看一眼很简单,就不会听你说了,却没有从一个没有丰富工作经验的人的角度去思考。楼主不要因为这些影响心态,不要怀疑自己,只要遇到一个“合适”的面试官就会好很多的。
点赞 评论 收藏
分享
评论
点赞
24
分享

创作者周榜

更多
牛客网
牛客企业服务