Target-Aware Spatio-Temporal Reasoning via Answering Questions in Dynamic Audio-Visual Scenarios

Yuanyuan Jiang, Jianqin Yin
Beijing University of Posts and Telecommunications

Preparation

Clone this repo

git clone https://github.com/Bravo5542/TJSTG.git

Download data and extract feature

MUSIC-AVQA: https://gewu-lab.github.io/MUSIC-AVQA/

Training

python net_tjstg/main.py --mode train

Testing

python net_tjstg/main.py --mode test

Notice

We improve our target-aware process to obtain a more robust performance. The experimental results based on the updated code are as follows:

Citation

@inproceedings{jiang2023avqa,
  title={Target-Aware Spatio-Temporal Reasoning via Answering Questions in Dynamics Audio-Visual Scenarios},
  author={Jiang, Yuanyuan and Yin, Jianqin},
  booktitle={Findings of the Association for Computational Linguistics: EMNLP 2023},
  year={2023},
  pages = "9399--9409"
}

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
data		data
grounding_gen/models_grounding_gen		grounding_gen/models_grounding_gen
net_tjstg		net_tjstg
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Target-Aware Spatio-Temporal Reasoning via Answering Questions in Dynamic Audio-Visual Scenarios

Preparation

Training

Testing

Notice

Citation

About

Releases

Packages

Languages

License

Bravo5542/TJSTG

Folders and files

Latest commit

History

Repository files navigation

Target-Aware Spatio-Temporal Reasoning via Answering Questions in Dynamic Audio-Visual Scenarios

Preparation

Training

Testing

Notice

Citation

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages