关于预训练BART的问题 #220

caijie12138 · 2021-11-07T02:40:42Z

您好
我尝试在您发布在huggingface的BART base chinese checkpoint上继续预训练，但是发现训练之后的效果反而更差了。

预训练之前：
[{'generated_text': '作为电子支付的平台，京东绝对是领先者而如今的刘强东已经是身价过亿的老板。'}]

预训练之后：
[{'generated_text': '作为电子。电子的平台，京东绝对是领先者。如今的刘强，已经是身价过去的老板。'}]

以下是我的预训练命令：
python3 pretrain.py --dataset_path cluecorpussmall_bart_seq512_dataset.pt
--pretrained_model_path pytorch_model.bin
--vocab_path models/google_zh_vocab.txt
--config_path models/bart/base_config.json
--output_model_path models/cluecorpussmall_bart_seq512_dataset.bin
--world_size 4 --gpu_ranks 0 1 2 3
--total_steps 30000000 --save_checkpoint_steps 100000 --report_steps 5000
--learning_rate 1e-4 --batch_size
--span_masking --span_max_length 3
--embedding word_pos --tgt_embedding word_pos
--encoder transformer --mask fully_visible --decoder transformer
--target bart --tie_weights
--has_lmtarget_bias

如果有问题的话，希望您能指出，感激不尽！

hhou435 · 2021-11-20T12:15:03Z

您好，可以提供一下您训练的语料以及preprocess的脚本么

caijie12138 · 2021-12-06T07:46:03Z

应该是checkpoint没加载正确的原因

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

关于预训练BART的问题 #220

关于预训练BART的问题 #220

caijie12138 commented Nov 7, 2021

hhou435 commented Nov 20, 2021

caijie12138 commented Dec 6, 2021

关于预训练BART的问题 #220

关于预训练BART的问题 #220

Comments

caijie12138 commented Nov 7, 2021

hhou435 commented Nov 20, 2021

caijie12138 commented Dec 6, 2021