贪心学院面试整理3
attention种类:
点积,乘法,加法
bleu计算: precision_list进行几何平均
seq2seq attention
命名实体识别:
bert+lstm+crf
Pointer Network: 全集找子集问题,从encoder里找到最大的
Pointer Generator Network:combine language model and Pointer Network
取加和的原因是可能有些词是相同的,比如I love love china。
MultiSource Pointer Network for Product Title:
多源数据做标题摘要
CopyNet:
解决OOV的一些典型问题,name, place, organization
- attentive read:如果decoder中出现了source里的词,则要concat一个context向量。
beam search
length normalization: 避免长度过长的情况,调节alpha值
coverage normalization:解决over-translation
coverage penalty:
i是encoder端,j是decoder端
end of sentence normalization:调节end of sentence出现的位置,鼓励长文本生成
模拟人写摘要的方式
探索模型可解释性