第四题还是要分情况 1、样本集重复率高的的情况下建trie-tree 2、一次型的用多线程分区,每个线程取游标定量检索当前分区,检索成功的interrupt所有线程 3、工程化/服务化的还是牺牲准确性用布隆过滤器,样本集要删的加计数,bit-set过80%的时候另起
1 3

相关推荐

牛客网
牛客企业服务