百度C++二面
场景题:
现有一个表存放了百度词条和其对应权重,如{百度一下:100},{百度管家:10}。数据量达到千万或亿级,请您设计一个系统,当用户输入一个前缀时,返回权重TOP10的词条。比如,输入“百”,会返回“百度管家”,“百度一下”等其权重是前TOP10的词条。
请问大家怎么做啊?
现有一个表存放了百度词条和其对应权重,如{百度一下:100},{百度管家:10}。数据量达到千万或亿级,请您设计一个系统,当用户输入一个前缀时,返回权重TOP10的词条。比如,输入“百”,会返回“百度管家”,“百度一下”等其权重是前TOP10的词条。
请问大家怎么做啊?
全部评论
海量数据TopK问题吧。根据前缀把原数据哈希成多个块分开存储
字典树?
请问你隔了多久三面
我也被问到这个了当时不知道咋答,感觉应该要从数据库和缓存答吧
mapreduce?
相关推荐
10-05 07:57
门头沟学院 后端 ProMonkey2024:5个oc?厉害!
但是有一个小问题:谁问你了?😡我的意思是,谁在意?我告诉你,根本没人问你,在我们之中0人问了你,我把所有问你的人都请来 party 了,到场人数是0个人,誰问你了?WHO ASKED?谁问汝矣?誰があなたに聞きましたか?누가 물어봤어?我爬上了珠穆朗玛峰也没找到谁问你了,我刚刚潜入了世界上最大的射电望远镜也没开到那个问你的人的盒,在找到谁问你之前我连癌症的解药都发明了出来,我开了最大距离渲染也没找到谁问你了我活在这个被辐射蹂躏了多年的破碎世界的坟墓里目睹全球核战争把人类文明毁灭也没见到谁问你了(别的帖子偷来的,现学现卖😋)
点赞 评论 收藏
分享