GitHub - IronmanVsThanos/ATM-Traffic: official repository for ATM-Traffic

🔥# ATM-Traffic: Adaptive Token Modulator for Roadside Traffic Scene Parsing🔥

📋This is the official implementation of "Cross-domain Traffic Scene Parsing via Vision Foundation Models: A Roadside Data Scarcity Solution" 🌟## Video

sunday.mp4

night.mp4

night2.mp4

snow.2.mp4

## Overview

Traffic scene parsing from roadside views faces significant challenges due to limited data availability and poor generalization of existing methods. We propose ATM (Adaptive Token Modulator), a novel approach that:

Efficiently leverages Vision Foundation Models (VFMs) for roadside traffic scene parsing
Achieves SOTA performance with only 2.5% trainable parameters
Shows strong generalization capability in zero-shot and few-shot scenarios
Performs robustly in challenging conditions (night, rain, etc.)

📊 Performance

🚀Parameter Efficiency: Achieves 78.9% mIoU on TSP6K using only 7.7M parameters (2.5% of full model)
🚀Zero-shot Performance:
- Cityscapes: 76.28% mIoU
- TSP6K: 54.57% mIoU
- RS2K: 64.10% mIoU
🚀Few-shot Learning: With <10% training data achieves:
- Cityscapes: 78.58% mIoU
- TSP6K: 62.35% mIoU
- RS2K: 68.46% mIoU

🚀Installation

# Clone the repository
git clone https://github.com/IronmanVsThanos/ATM-Traffic.git
cd ATM-Traffic
conda install pytorch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 pytorch-cuda=11.7 -c pytorch -c nvidia -y
pip install -U openmim
mim install mmengine
mim install "mmcv>=2.0.0"
pip install "mmsegmentation>=1.0.0"
pip install "mmdet>=3.0.0"
pip install xformers=='0.0.20' # optional for DINOv2
pip install -r requirements.txt
pip install future tensorboard
# Install dependencies
pip install -r requirements.txt

💡Dataset Preparation

├── data
│   ├── cityscapes
│   │   ├── leftImg8bit
│   │   │   ├── train
│   │   │   ├── val
│   │   ├── gtFine
│   │   │   ├── train
│   │   │   ├── val
│   ├── tsp6k
│   │   ├── leftImg8bit
│   │   |   ├── train
│   │   │   ├── val
│   │   ├── labels
│   │   |   ├── train
│   │   │   ├── val

🚀Pretraining Weights

Download: Download pre-trained weights(512512 or 10241024) from:链接: https://pan.baidu.com/s/1ayhDCYFoJ-FV9e5XwSnKBw?pwd=e93a 提取码: e93a The RS3K dataset is currently undergoing data desensitization and will be coming soon.

🌟Training

PORT=12345 CUDA_VISIBLE_DEVICES=1,2,3,4 bash tools/dist_train.sh configs/dinov2/atm_dinov2_mask2former_1024x1024_bs4x2.py NUM_GPUS

🌟Evaluation

CUDA_VISIBLE_DEVICES=1,2,3,4 python tools/test.py configs/dinov2/atm_dinov2_mask2former_1024x1024_bs4x2.py  work_dirs/atm_dinov2_mask2former_1024x1024_bs4x2/iter_40000.pth --backbone ./checkpoints/dinov2_converted_1024x1024.pth

🌟Visulioze

🚀 for img:

python tools/visualize.py /path/to/cfg /path/to/checkpoint /path/to/images --backbone /path/to/converted_backbone

🚀 for video:

 python tools/visualize_video.py /path/to/cfg /path/to/checkpoint /path/to/images --backbone /path/to/converted_backbone

Name		Name	Last commit message	Last commit date
Latest commit History 101 Commits
.idea		.idea
.vscode		.vscode
atm		atm
configs		configs
tools		tools
.gitignore		.gitignore
LICENSE.txt		LICENSE.txt
README.md		README.md
nohup.out		nohup.out
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

📊 Performance

🚀Installation

💡Dataset Preparation

🚀Pretraining Weights

🌟Training

🌟Evaluation

🌟Visulioze

About

Releases

Packages

Contributors 2

Languages

License

IronmanVsThanos/ATM-Traffic

Folders and files

Latest commit

History

Repository files navigation

📊 Performance

🚀Installation

💡Dataset Preparation

🚀Pretraining Weights

🌟Training

🌟Evaluation

🌟Visulioze

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages