mt2018-tartu-shared-task / RL4NMT Public

forked from apeterswu/RL4NMT

Notifications You must be signed in to change notification settings
Fork 0
Star 0

Reinforcement Learning for Neural Machine Translation

0 stars 48 forks Branches Tags Activity

Notifications

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
docs		docs
eten		eten
tensor2tensor		tensor2tensor
zhen_wmt17		zhen_wmt17
README.md		README.md
datagen.sh		datagen.sh
setup.py		setup.py
test_eten.sh		test_eten.sh
test_zhen.sh		test_zhen.sh
train_eten.sh		train_eten.sh
train_zhen_bi_src.sh		train_zhen_bi_src.sh
train_zhen_bi_src_tgt.sh		train_zhen_bi_src_tgt.sh
train_zhen_bi_tgt.sh		train_zhen_bi_tgt.sh
train_zhen_src.sh		train_zhen_src.sh
train_zhen_src_tgt.sh		train_zhen_src_tgt.sh
train_zhen_tgt.sh		train_zhen_tgt.sh
train_zhen_tgt_src.sh		train_zhen_tgt_src.sh

Repository files navigation

Reinforcement Learning for Neural Machine Translation

EMNLP 2018 paper: A Study of Reinforcement Learning for Neural Machine Translation

Dataset and models will be relased if needed.

Reinforcement Learning for Neural Machine Translation (RL4NMT) based on Transformer

Take WMT17 Chinese-English translation as example:

Different training strategies are provided.

Different RL training strategies for NMT, evaluated on bilingual dataset.
(1) HPARAMS=zhen_wmt17_transformer_rl_total_setting: terminal reward + beam search
(2) HPARAMS=zhen_wmt17_transformer_rl_delta_setting: reward shapping + beam search
(3) HPARAMS=zhen_wmt17_transformer_rl_delta_setting_random: reward shapping + multinomial sampling
(4) HPARAMS=zhen_wmt17_transformer_rl_total_setting_random: terminal reward + multinomial sampling
(5) HPARAMS=zhen_wmt17_transformer_rl_delta_setting_random_baseline: reward shaping + multinomial sampling + reward baseline
(6) HPARAMS=zhen_wmt17_transformer_rl_delta_setting_random_mle: reward shapping + multinomial sampling + objectives combination
Different monolingual data combination traininig in RL4NMT
(1) zhen_src_mono: source monolingual data RL training based on bilingual data MLE model
(2) zhen_tgt_mono: target monolingual data RL training based on bilingual data MLE model
(3) zhen_src_tgt_mono: sequential mode [target monolingual data RL trianing based on (bilingual + source monolingual data) MLE model]
(4) zhen_tgt_src_mono: sequential mode [source monolingual data RL training based on (bilinugal + target monolingual data) MLE model]
(5) zhen_bi_src_tgt_mono: unified model

Supports MRT (minimum risk training) for NMT.

About

Reinforcement Learning for Neural Machine Translation

Custom properties

Report repository

Releases

No releases published

Packages

No packages published

Languages

Python 97.4%
Jupyter Notebook 1.2%
Other 1.4%