补发:星环科技实习nlp算法岗面经
之前被我删了,补发。
1.自我介绍
2.介绍项目:需要从项目的数据来源,项目的任务,模型的详细构建过程来介绍
3.针对项目的提问:
a.word2vec有多种实现方式,项目所用的是哪种?bert有哪些优点,bert是怎样构建的。你是如何应用bert的。
b.在实体识别中,如果实体没有标签,该如何抽取。半监督和弱监督是如何实现的。
c.知识图谱的构建步骤是怎样的。
d.问答系统中,如果问句长度不同,但是问题含义相同,应该如何处理?如果问句长度相同,但是其含义不同,例如(是,不是)该如何判别
e.介绍kmeans和主题模型lda的实现过程
f.你为什么要在lstm的隐层后接入attention机制,而不是在其他地方。
g.gru和lstm的不同点有哪些,gru为什么比lstm训练的快
h.例如需要抽取企业中的信息,关于企业建立的时间,企业法人代表等。无论是否有标签,你将采取什么样的办法。如果是金融领域呢?
i.在关系抽取中,关系是无向的,例如a-父子-b,如果抽取有向关系应该如何抽取,例如确定a-父亲-b,b-儿子-a
j.对于文本较长,其中有多个实体多种关系,应该如何处理。实体关系一同抽取的利弊。
4.数据结构(没得问了)
a.如何查找链表有环?
b.快指针走三步呢?
5.良言
现在算法太多了,你们软件工程啊,建议还是拿起java,多练练编程。
6.实习时间
7.你还有其他问题没