Beyond Objects: Contextual Synthetic Data Generation for Fine-Grained Classification

Authors: William Yang, Xindi Wu, Zhiwei Deng, Esin Tureci, and Olga Russakovsky

Beyond Objects is a framework for generating contextual synthetic data to improve fine-grained visual classification in low-data regimes. We fine-tune text-to-image (T2I) diffusion models with LoRA on few-shot examples, generate high-quality synthetic images, and train downstream classifiers on real + synthetic data.

Installation

To set up:

conda create -n BeyondObjects python=3.10.12
conda activate BeyondObjects
pip install -r requirements.txt

Quick Start

The full pipeline has three stages: data prep → T2I fine-tuning → synthetic data generation → classifier training.

Prepare datasets

cd dataset

# Few-shot splits from Diff-II
bash download_fewshot.sh

# Full datasets (Aircraft, Pet, CUB)
python download_real.py

# Stanford Cars (manual): download from Kaggle and place under dataset/real_datasets/car/
# Flowers-102 LT (manual): download and place under dataset/real_datasets/flower/

Fine-tune the T2I model with LoRA

cd finetune
accelerate config   # disable mixed precision

# Edit finetune.sh to point to your YAML under ../yaml/
bash finetune.sh

Generate contextual synthetic images

cd generation
# Edit run.sh to point to your YAML under ../yaml/
bash run.sh [0-49]  # optional array job index

# For multi-GPU parallel generation, see batch_submission.py

Train downstream classifier (hyperparameter sweep)

cd classification

# CLIP backbone
bash run_validation.sh clip [lr] [weight_decay] [lambda] [yaml_file]

# ImageNet ResNet-50 backbone
bash run_validation.sh imagenet [lr] [weight_decay] [lambda] [yaml_file]

# MAE backbone
bash run_mae_validation.sh [lr] [weight_decay] [lambda] [yaml_file]

# Automated multi-GPU hyperparameter sweep
python hyperparameter_sweep.py

Evaluation

After selecting best hyperparameters from validation:

cd classification
python submit_final.py       # CLIP / ResNet
python submit_mae_final.py   # MAE

Results and logs are tracked with Weights & Biases (run wandb login).

Acknowledgements: This work builds on: Hugging Face Diffusers, DataDream, Diff-II, and Stable Diffusion

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
captions		captions
classification		classification
dataset		dataset
finetune		finetune
generation		generation
yaml		yaml
.gitignore		.gitignore
README.md		README.md
method.png		method.png
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Beyond Objects: Contextual Synthetic Data Generation for Fine-Grained Classification

Installation

Quick Start

Evaluation

About

Uh oh!

Releases

Packages

Languages

princetonvisualai/BeyondObjects

Folders and files

Latest commit

History

Repository files navigation

Beyond Objects: Contextual Synthetic Data Generation for Fine-Grained Classification

Installation

Quick Start

Evaluation

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages