携程算法问了道流数据抽样的问题(感觉很多大数据公司都会问):假设有一组数据流元素有 N 个(事先不知道 N 具体值),我们希望选择 n 个样本(N >= n),使用怎样的策略进行抽样可以使得数据流中每个元素被选择的概率恰为 n / N? 转自https://mp.weixin.qq.com/s?__biz=MzA3NzkxODc1OQ==&tempkey=OTM4X0p4eGVydElKdjdKcGNyZzBMd000bk40a3hRUWlOQkVUdGt1elVlMEUxN2NpWU1HVnMxRlJXMTJNdFFyQk9aWXNpdnoyZVYzSnk2Z1EzOHF...