GitHub - showlab/DiffSim: Official repository of DiffSim: Taming Diffusion Models for Evaluating Visual Similarity

DiffSim: Taming Diffusion Models for Evaluating Visual Similarity

Yiren Song · Xiaokang Liu · Mike Zheng Shou

National University of Singapore

📢 News

[Dec.19.2024] Release DiffSim paper and source codes.

Preparation

Dataset / Benchmarks Download

Please download any of the 7 benchmarks below for evaluation:

Sref

Sref is a benchmark we propose. We have collected 508 styles, each hand-picked by human artists and featuring four thematically distinct reference images, created using Midjourney’s Sref mode. Midjourney’s style reference feature allows users to guide the style or aesthetic of generated images by using external pictures or style seeds in their prompt.

Please download the benchmark at here.

IP

IP is a benchmark we propose. We have collected images of 299 IP characters and used advanced Flux models and the IP-Adapter to create several variants of each character with different consistency weights.

Please download the benchmark at here.

CUTE

NIGHTS

InstantStyle

TID2013

DreamBench++

Installation

Experiment System Info: Debian 5.4, Cuda 12.1
Evaluation Requirements: GPU inference with about 10k MB memory or CPU inference

conda create -n "diffsim" python=3.12.7
conda activate diffsim
pip3 install -r requirements.txt

Similarity Evaluation

DiffSim

For evaluating each benchmark, please refer to the corresponding bash script. For example, you can evaluate DiffSim on CUTE dataset by sh cute_main.sh.

The script and arguments details are as follows:

python -u cute_main.py --image_path "/tiamat-NAS/songyiren/dataset/CUTE/" --image_size 512 --target_block "up_blocks" --target_layer 0 --target_step 600 --similarity "cosine" --seed 2334 --metric "diffsim"

--image_path: Root path to the image dataset. Please modify to your downloaded folder.
--image_size: The image resolution.
--target_block: Specify which part of the UNet is used in DiffSim setting. ("up_blocks", "down_blocks" and "mid_blocks")
--target_layer: Specify which attention layer within target_block is used in DiffSim setting.
--target_step: Specify denosing step used in DiffSim setting.
--metric: Specify which metric to evaluate. ("diffsim", "clip_cross", "dino_cross")

Note: it may take more than 30 minutes to evaluate for a complete run on some benchmarks.

Citation

If you find this codebase useful for your research, please use the following entry.

TODO

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
DiT		DiT
assets		assets
diffsim		diffsim
metrics		metrics
.gitignore		.gitignore
README.md		README.md
argprocess.py		argprocess.py
cute_main.py		cute_main.py
cute_main.sh		cute_main.sh
dreambench_main.py		dreambench_main.py
dreambench_main.sh		dreambench_main.sh
ipref_main.py		ipref_main.py
ipref_main.sh		ipref_main.sh
night_main.py		night_main.py
night_main.sh		night_main.sh
requirements.txt		requirements.txt
retrieval_vis.py		retrieval_vis.py
style_main.py		style_main.py
style_main.sh		style_main.sh
tid_main.py		tid_main.py
tid_main.sh		tid_main.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

DiffSim: Taming Diffusion Models for Evaluating Visual Similarity

📢 News

Preparation

Dataset / Benchmarks Download

Sref

IP

CUTE

NIGHTS

InstantStyle

TID2013

DreamBench++

Installation

Similarity Evaluation

DiffSim

Citation

About

Releases

Packages

Contributors 2

Languages

showlab/DiffSim

Folders and files

Latest commit

History

Repository files navigation

DiffSim: Taming Diffusion Models for Evaluating Visual Similarity

📢 News

Preparation

Dataset / Benchmarks Download

Sref

IP

CUTE

NIGHTS

InstantStyle

TID2013

DreamBench++

Installation

Similarity Evaluation

DiffSim

Citation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages