面向金融领域的小样本跨类迁移事件抽取 第三名 方案及代码
我们在 CCKS2020 大会分享的 技术方案PPT分享于此提取码:bfd1
依赖文件路径code/conda.txt 和 code/pip.txt
耗时(eg. Nvdia 2080Ti):
分类模块:1015 min
事件抽取模型(esemble): 67 hour
训练集数据路径:code/CCKS-Cls/dataset/trans_train.json 测试集数据路径:code/CCKS-Cls/dataset/trans_test.json
cd /code/CCKS-Cls/ sh classification.sh 得到分类结果文件:/code/CCKS-Cls/test_output/cls_out_single.csv
说明:chinese_roberta_wwm_large_ext_pytorch 预训练模型文件路径 code/CCKS-Cls/pretrained_model/Bert-wwm-ext/ 下载链接: http://pan.iflytek.com/#/link/9B46A0ABA70C568AAAFCD004B9A2C773 提取密码:43eH
训练集数据路径:code/data/train/trans_train.json 以及code/data/train/train_base.json(这个是A榜的训练集,需要加入进来,作为预训练模型的”权重学习资料”) 测试集数据路径:code/data/dev/trans_test.json
cd /code/ sh aug.sh 根目录得到结果文件 /code/result.json
下载链接: http://pan.iflytek.com/#/link/9B46A0ABA70C568AAAFCD004B9A2C773 提取密码:43eH
2.迁移权重学习:首先transfer_train_roberta_model_aug.py会利用trans_train.json和train_base.json中所有数据进行预训练模型(roberta)的权重学习,并保存预训练模型的权重参数,作为后续模型训练的基础预训练模型(roberta)权重,参与到后续的学习
code/saved_model_roberta_db_1_1/esemble code/saved_model_roberta_pj_1_1/esemble code/saved_model_roberta_qsht_1_1/esemble code/saved_model_roberta_sg_1_1/esemble code/saved_model_roberta_zb_1_1/esemble