美团算法凉凉凉凉经:从去年春天面到今年春天,终于告别美团了
没啥好说的,面试官人真的很nice, 问的问题也很发散。
2021-03-24
聊项目 30min
中途聊了会儿实习 问华为实习让你感受怎么样
发散性的题:
1 现在你有一个文件,然后文件的每一行都有一行,你需要去统计这个文件的词频,但是现在内存不够你怎么去解决? 单机的统计
简单的去做的话就是用Hashmap去统计;
但是他说Hashmap key容量不够; 问我hashmap的扩容机制 (这个问题去年春天面Java岗的时候也问到了,此刻我忘了)
然后说到了红黑树去解决这些问题, 问红黑树结构 怎么扩容
后来引导去答分布式。。。问分布式有什么好处
排序+分块数据。
问内存还是不够,你怎么排序
粗略排序
2 现在假设你已经得到了所有数据的词频, 你有一个函数,每次通过调用这个函数, 返回一个单词,你怎么设计这个函数,能够通过不断的调用这个函数 了解他的分布?
3 现在有很多词和很多词的词频分布,你怎么去采样,比如说我现在有一万条的用户数据, 我想去采样一千条数据 反映所有数据的大概情况。 你怎么采样?
没思路
他说你下去可以看看word2vec的采样代码,里面有段代码告诉你了怎么去实现采样。。我:? 啊,原来跟word2vec有关系,好歹是在我的知识范围内了。
# 业务和技术栈
美团xxnlp部门
# 后来说面试官问的问题很独特, 发散性很强。
他说这跟面试官的风格很有关系,他觉得去考代码可以提前准备(大概意思是nlp+机器学习+算法这些你们都能提前准备), 所以他更愿意去问一些发散性的问题去考察平时的积累
感谢捞我起来, 今天受教了。
再见