2020/09/21 腾讯微保NLP笔试哭经
单选题(好像是五个题)
1、tanh/sigmoid/tanh的一个变种的说法以下说法错误的是(tanh不能解决梯度消失的问题)
2、给定两个文本的词汇表列表,以及特征值词汇表dict, 求查询向量与两个文本之间的相似度,这里二值向量指的是0/1么?
3、下列关于红黑树说法错误的是(红黑树的节点总是红色的,应该是黑色)
4、梯度下降法的过程是 4 3 5 12?
5、智力题(挂)
多选题 (好像也是五个)
1、sigmoid函数说法正确的是(定义域正无穷到负无穷,处处可导,值域0到1, 还一个忘了)
2、关于CRF说法正确的是,(CRF是无向图,CRM解决了MEMM的标志偏置问题,CRF是生成模型,还一个忘了)
3、下列可以计算相似度的是? (知识点盲区)
4、 忘了
5、忘了
忘了大概是我不会的题,总之多选题多选满分,少选1分,
问答题(4题,竟然真的手推网络结构和原理)
1、阐述word2vec中CBOW以及skip-gram模型的原理, 并且说明为什么要引入层次化的softmax以及negative sampling ?
阐述他们的结构
2、(每家NLP都离不开BERT和transformer)阐述BERT的网络结构以及它的训练过程, 并解释BERT的masked language model 和CBOW有什么异同之处??
3、 请根据词向量dict 以及输入句子[??忘了]进行分词,没读懂想让我们干什么。。
4、给定一段对话语料库,问你如何抽取其中的实体以及属性关系, 是跟卖保险相关的语料库,要求给出每个模块的具体使用到的模型
编程题15分
给定一组乱序正整数数组,输出满足有效三角形的子集个数, 要求时间复杂度尽可能的低。他家最坑的是ACM模式,不能使用线下IDE, 于是调bug调了半天,不知为何最后两分钟没注重时间复杂度的代码也A了。
就考的真的很NLP
于是挂。