首页 > 试题广场 >

Seq2Seq模型在解码时可以使用贪心法或Beam Sear

[单选题]
Seq2Seq模型在解码时可以使用贪心法或Beam Search方法。()
  • 正确
  • 错误
seq2seq的语言模型在解码时,每次选择出现概率最大的词作为预测值,所以属于贪心
发表于 2020-07-19 11:42:44 回复(0)
beam search有一个超参数beam size(束宽)记为k。第一个时间步长,选取当前条件概率最大的 k个词,当做候选输出序列的第一个词。之后的每个时间步长,基于上个步长的输出序列,挑选出所有组合中条件概率最大的 k 个,作为该时间步长下的候选输出序列。始终保持 [公式] 个候选。最后从 k个候选中挑出最优的。
发表于 2021-04-07 17:05:04 回复(0)