神经机器翻译的混合交叉熵损失函数 | ICML 2021

所以Mixed CE和label smoothing是不同的。并且从BLEU的分数可以看出, label smoothing和Mixed CE并不是一个互斥的关系,两者共用效果会更好。 在SS中,我们以SS和word oracle(SS的一个变...

That is quite a big difference! “差距”是个名词, "Chaju" here is a noun 就是指事物之间的差别程度。 that means difference, disparity, or gap. 韩佳: “差距”是个名词, "Chaju" here is a noun 就是指事物之间的差别程度。 that means difference, disparity...

更多内容请点击:神经机器翻译的混合交叉熵损失函数 | ICML 2021 推荐文章