Vision benchmark

Here is a short summary of our solution on Vision benchmark. One can obtain the pre-trained models used below from here.

CIFAR10

The example of fine-tuning and doing inference on CIFAR10 dataset with ViT-base-patch16-224-in21k:

python3 finetune/run_image_classifier.py --pretrained_model_path models/vit_base_patch16_224_model.bin \
                                         --tokenizer virtual \
                                         --config_path models/vit/base-16-224_config.json \
                                         --train_path datasets/cifar10/train.tsv \
                                         --dev_path datasets/cifar10/test.tsv \
                                         --output_model_path models/image_classifier_model.bin \
                                         --epochs_num 3 --batch_size 64

python3 inference/run_image_classifier_infer.py --load_model_path models/image_classifier_model.bin \
                                                --tokenizer virtual \
                                                --config_path models/vit/base-16-224_config.json \
                                                --test_path datasets/cifar10/test.tsv \
                                                --prediction_path datasets/cifar10/prediction.tsv \
                                                --labels_num 10

The example of fine-tuning and doing inference on CIFAR10 dataset with ViT-large-patch16-224-in21k:

python3 finetune/run_image_classifier.py --pretrained_model_path models/vit_large_patch16_224_model.bin \
                                         --tokenizer virtual \
                                         --config_path models/vit/large-16-224_config.json \
                                         --train_path datasets/cifar10/train.tsv \
                                         --dev_path datasets/cifar10/test.tsv \
                                         --output_model_path models/image_classifier_model.bin \
                                         --epochs_num 3 --batch_size 64

python3 inference/run_image_classifier_infer.py --load_model_path models/image_classifier_model.bin \
                                                --tokenizer virtual \
                                                --config_path models/vit/large-16-224_config.json \
                                                --test_path datasets/cifar10/test.tsv \
                                                --prediction_path datasets/cifar10/prediction.tsv \
                                                --labels_num 10

CIFAR100

The example of fine-tuning and doing inference on CIFAR100 dataset with ViT-base-patch16-224-in21k:

python3 finetune/run_image_classifier.py --pretrained_model_path models/vit_base_patch16_224_model.bin \
                                         --tokenizer virtual \
                                         --config_path models/vit/base-16-224_config.json \
                                         --train_path datasets/cifar100/train.tsv \
                                         --dev_path datasets/cifar100/test.tsv \
                                         --output_model_path models/image_classifier_model.bin \
                                         --epochs_num 3 --batch_size 64

python3 inference/run_image_classifier_infer.py --load_model_path models/image_classifier_model.bin \
                                                --tokenizer virtual \
                                                --config_path models/vit/base-16-224_config.json \
                                                --test_path datasets/cifar100/test.tsv \
                                                --prediction_path datasets/cifar100/prediction.tsv \
                                                --labels_num 100

The example of fine-tuning and doing inference on CIFAR10 dataset with ViT-large-patch16-224-in21k:

python3 finetune/run_image_classifier.py --pretrained_model_path models/vit_large_patch16_224_model.bin \
                                         --tokenizer virtual \
                                         --config_path models/vit/large-16-224_config.json \
                                         --train_path datasets/cifar100/train.tsv \
                                         --dev_path datasets/cifar100/test.tsv \
                                         --output_model_path models/image_classifier_model.bin \
                                         --epochs_num 3 --batch_size 64

python3 inference/run_image_classifier_infer.py --load_model_path models/image_classifier_model.bin \
                                                --tokenizer virtual \
                                                --config_path models/vit/large-16-224_config.json \
                                                --test_path datasets/cifar100/test.tsv \
                                                --prediction_path datasets/cifar100/prediction.tsv \
                                                --labels_num 100

Home
主页
- 项目特色
- 依赖环境
- 快速上手
- 预训练数据
- 下游任务数据集
- 预训练模型仓库
- 使用说明
- 竞赛解决方案
  - 中文任务测评基准CLUE
  - SMP2020-EWECT
  - SMP2019-ECISA
  - CCF-BDCI2021-面向黑灰产治理的恶意短信变体字还原
  - 英文任务测评基准GLUE
  - 视觉任务评测基准
- 引用

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Vision benchmark

CIFAR10

CIFAR100

Clone this wiki locally