Q-ViT-DeiT

DeiT implementation for Q-ViT.

This code is built upon DeiT[https://github.com/facebookresearch/deit] and hustzxd's implementation[https://github.com/hustzxd/LSQuantization] for the LSQ paper.

Environments

PyTorch 1.7.0+ and torchvision 0.8.1+ and pytorch-image-models 0.3.2

conda install -c pytorch pytorch torchvision
pip install timm==0.3.2

How To Use

Train a float baseline using the script float_train.sh

For example:

python -m torch.distributed.launch \
--nproc_per_node=8 --use_env main.py \
--model deit_tiny_patch16_224_float \
--batch-size 256 \
--dist-eval \
--epochs 300 \
--output_dir path/to/float

Using unifrom_train.sh to train uniform-quantized qat model

For example:

wbits=4
abits=4
lr=5e-4
epochs=300
id=4bit_uniform

python -m torch.distributed.launch \
--nproc_per_node=8 --use_env main.py \
--model deit_tiny_patch16_224_mix \
--batch-size 64 \
--lr ${lr} \
--min-lr 0 \
--epochs ${epochs} \
--warmup-epochs 0 \
--wbits ${wbits} \
--abits ${abits} \
--dist-eval \
--output_dir path/to/uniform \
--finetune path/to/float

Using mixed_train.sh to train Q-ViT

For example:

wbits=5
abits=5
lr=2e-04
wd=0.05
epochs=300
lbd=1e-1
budget=21.455
id=4bit_mixed

python -m torch.distributed.launch \
--nproc_per_node=8 --use_env main.py \
--model deit_tiny_patch16_224_mix \
--batch-size 64 \
--lr ${lr} \
--min-lr 0 \
--epochs ${epochs} \
--weight-decay ${wd} \
--warmup-epochs 0 \
--wbits ${wbits} \
--abits ${abits} \
--bitops-scaler ${lbd} \
--budget ${budget} \
--stage-ratio 0.9 \
--dist-eval \
--mixpre \
--head-wise \
--output_dir path/to/mixed \
--finetune path/to/float

Here in Q-ViT, the arguments wbits and abits determines the initial bit-widths for weights and activations.

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
.circleci		.circleci
.github		.github
models		models
quantization		quantization
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
datasets.py		datasets.py
engine.py		engine.py
float_train.sh		float_train.sh
hubconf.py		hubconf.py
losses.py		losses.py
main.py		main.py
mixed_train.sh		mixed_train.sh
samplers.py		samplers.py
tox.ini		tox.ini
uniform_train.sh		uniform_train.sh
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Q-ViT-DeiT

Environments

How To Use

Train a float baseline using the script float_train.sh

Using unifrom_train.sh to train uniform-quantized qat model

Using mixed_train.sh to train Q-ViT

Desired Results

About

Releases

Packages

Languages

License

zhexinli/Q-ViT-DeiT

Folders and files

Latest commit

History

Repository files navigation

Q-ViT-DeiT

Environments

How To Use

Train a float baseline using the script float_train.sh

Using unifrom_train.sh to train uniform-quantized qat model

Using mixed_train.sh to train Q-ViT

Desired Results

About

Resources

License

Code of conduct

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages