ADS-Cap: A Framework for Accurate and Diverse Stylized Captioning with Unpaired Stylistic Corpora

This repo provides the source code & data of our paper: ADS-Cap: A Framework for Accurate and Diverse Stylized Captioning with Unpaired Stylistic Corpora.

@inproceedings{cheng2022ads,
  title={ADS-Cap: A Framework for Accurate and Diverse Stylized Captioning with Unpaired Stylistic Corpora},
  author={Cheng, Kanzhi and Ma, Zheng and Zong, Shi and Zhang, Jianbing and Dai, Xinyu and Chen, Jiajun},
  booktitle={CCF International Conference on Natural Language Processing and Chinese Computing},
  pages={736--748},
  year={2022},
  organization={Springer}
}

Prepare data

Step1: prepare SentiCap img generate_senticapimg.py

Step2: generate resnet features for all used images generate_resnet_feat.py

Step3: prepare objects vocabulary using VG dataset's object labels generate_objectvocab.py

Step4: prepare data of FlcikrStyle and SentiCap prepro_flickrstyledata.py & prepro_senticapdata.py

Step5: construct train/val/test data generate_dataset.py

Step6: prepare for calculating PPL using SRILM generate_srilm.py, reference: https://blog.csdn.net/u011500062/article/details/50781101, https://ynuwm.github.io/2017/05/24/SRILM训练语言模型实战/, http://www.mamicode.com/info-detail-1944347.html

Step7: build vocab build_vocab.py

Step8: prepare json file for pycocoeval generate_cocoeval.py

Training

Step1: pretrain on coco dataset CUDA_VISIBLE_DEVICES=0 python train_cvae.py --id cvae_k0.03_s1.0 --kl_rate 0.03 --style_rate 1.0 --save_model_freq 20000

Step2: finetune on stylized datasets CUDA_VISIBLE_DEVICES=0 python train_cvae.py --id cvae_k0.03_s1.0_ft --kl_rate 0.03 --style_rate 1.0 --finetune True --pretrain_id cvae_k0.03_s1.0 --pretrain_step 80000 --batch_size 50 --lr 5e-5 --save_model_freq 2700

Evaluation

Step1: generate captions and calculate accuracy metrics CUDA_VISIBLE_DEVICES=0 python test_cvae.py --id cvae_k0.03_s1.0_ft --step 108000

Step2: calculate diversity metrics; diversity across image python test_diversity.py cvae_k0.03_s1.0_ft 108000 1 no, diversity for one image python test_diversity.py cvae_k0.03_s1.0_ft 108000 2 yes

Name	Name	Last commit message	Last commit date
Latest commit njucckevin add vocab.pkl Dec 25, 2023 7ad5751 · Dec 25, 2023 History 6 Commits
.idea	.idea	annotation and readme	Sep 5, 2022
PPL	PPL	ADS-Cap	Jul 16, 2022
__pycache__	__pycache__	ADS-Cap	Jul 16, 2022
bert_style_classifier_ckpts	bert_style_classifier_ckpts	update bibtex and evaluate_diy function	Jul 29, 2023
data	data	add vocab.pkl	Dec 25, 2023
log	log	ADS-Cap	Jul 16, 2022
models	models	ckpts for recheck model	Sep 22, 2023
scripts	scripts	annotation and readme	Sep 5, 2022
utils	utils	update bibtex and evaluate_diy function	Jul 29, 2023
vis	vis	ADS-Cap	Jul 16, 2022
.DS_Store	.DS_Store	update bibtex and evaluate_diy function	Jul 29, 2023
config.py	config.py	annotation and readme	Sep 5, 2022
data_load.py	data_load.py	ADS-Cap	Jul 16, 2022
eval.py	eval.py	update bibtex and evaluate_diy function	Jul 29, 2023
feature_analyse.py	feature_analyse.py	ADS-Cap	Jul 16, 2022
latent_analyse.py	latent_analyse.py	ADS-Cap	Jul 16, 2022
readme.md	readme.md	arxiv	Aug 3, 2023
test_cvae.py	test_cvae.py	ADS-Cap	Jul 16, 2022
test_diversity.py	test_diversity.py	ADS-Cap	Jul 16, 2022
test_stylelabel.py	test_stylelabel.py	ADS-Cap	Jul 16, 2022
train_cvae.py	train_cvae.py	ADS-Cap	Jul 16, 2022
train_recheck.py	train_recheck.py	annotation and readme	Sep 5, 2022
train_stylelabel.py	train_stylelabel.py	annotation and readme	Sep 5, 2022

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ADS-Cap: A Framework for Accurate and Diverse Stylized Captioning with Unpaired Stylistic Corpora

Prepare data

Training

Evaluation

About

Releases

Packages

Languages

njucckevin/ADS-Cap

Folders and files

Latest commit

History

Repository files navigation

ADS-Cap: A Framework for Accurate and Diverse Stylized Captioning with Unpaired Stylistic Corpora

Prepare data

Training

Evaluation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages