首页 期刊 北京大学学报·自然科学版 面向维汉神经机器翻译的双向重排序模型分析 【正文】

面向维汉神经机器翻译的双向重排序模型分析

作者:张新路; 李晓; 杨雅婷; 王磊; 董瑞 中国科学院新疆理化技术研究所; 乌鲁木齐830011; 中国科学院大学; 北京100049; 新疆民族语音语言信息处理实验室; 乌鲁木齐830011
神经机器翻译   集成学习   双向重排序   维吾尔语  

摘要:在维吾尔语到汉语等低资源语料库上,神经机器翻译的拟合训练容易陷入局部最优解,导致单一模型的翻译结果可能不是全局最优解。针对此问题,通过集成策略,有效整合多个模型预测的概率分布,将多个翻译模型作为一个整体;同时采用基于交叉熵的重排序方法,将具有相反解码方向的翻译模型相结合,最终选出综合得分最高的候选翻译作为输出。在CWMT2015维汉平行语料上的实验结果表明,与单一的Transformer模型相比,改进后的方法提升4.82个BLEU值。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅