Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

RTDETRv2 #179

Open
lyuwenyu opened this issue Jan 9, 2024 · 22 comments
Open

RTDETRv2 #179

lyuwenyu opened this issue Jan 9, 2024 · 22 comments

Comments

@lyuwenyu
Copy link
Owner

lyuwenyu commented Jan 9, 2024

https://arxiv.org/abs/2407.17140


I will release the rtdetrv2 soon, which will provide a better deployment experience and higher accuracy.

You can start this repo to follow news


The AP of rtdetrv2_r18vd on the COCO-val2017 dataset is increased by 1.4 and maintains the same inference speed compared with RTDETRv1. In addition, in order to make rtdetr everywhere, we provide rtdetrv2_r18vd_dsp that utilizes discrete deformable attention instead of deformable attention with negligible differences on AP50val compared with rtdetrv2_r18vd.

Figure
image
@lyuwenyu lyuwenyu pinned this issue Jan 9, 2024
@lyuwenyu lyuwenyu changed the title Pytorch RTDETRv2 (comming soon) RTDETRv2 (comming soon) Jan 9, 2024
@CatfishW
Copy link

v2有哪些结构上的变化呀ovo

@huihui308
Copy link

huihui308 commented Jan 23, 2024

Do you have smaller model which can be trained on 3080ti?

@Ryanshuai
Copy link

求大佬更新pytorch v2!

@leoxxxxxD
Copy link

@lyuwenyu 大佬 v2年前可能开源吗

@BUG1989
Copy link

BUG1989 commented Feb 19, 2024

@lyuwenyu 大佬,来催更了。之前的预训练模型里面的 add op 有 infinity 数据。模型量化会有问题
image

@BUG1989
Copy link

BUG1989 commented Feb 22, 2024

我的问题我们已经解决了,在我司的芯片上运行效果挺好。

@SoulProficiency
Copy link

RTDETR可以转rknn吗?

@SoulProficiency
Copy link

我的问题我们已经解决了,在我司的芯片上运行效果挺好。 b7ace8de6dfabb44cce40f5677638a7

老哥,你们的芯片是rk的吗?

@BUG1989
Copy link

BUG1989 commented Feb 27, 2024

我的问题我们已经解决了,在我司的芯片上运行效果挺好。 b7ace8de6dfabb44cce40f5677638a7

老哥,你们的芯片是rk的吗?

爱芯元智,AX650N

@zhouzq-thu
Copy link

waiting

@Peterande
Copy link

您好,请问v2有投稿意向吗?能得知大概会在什么时间范围内放出嘛?
我也有意向将RT-DETR这个IP做下去,像YOLO一样形成V2,V3....并且也取得了一些成果,
但似乎在您的官方v2发布前我无法擅自进行这种延续性的命名qwq

@lyuwenyu
Copy link
Owner Author

lyuwenyu commented May 13, 2024

您好,请问v2有投稿意向吗?能得知大概会在什么时间范围内放出嘛? 我也有意向将RT-DETR这个IP做下去,像YOLO一样形成V2,V3....并且也取得了一些成果, 但似乎在您的官方v2发布前我无法擅自进行这种延续性的命名qwq


@Peterande 非常抱歉本issue名字给你带来的困扰


另外也非常高兴社区有RTDETR方向的优化,非常期待成果。( 这也是我们开源的目的之一 )

  1. RTDETRv2是我们刚发布v1之后的产物,是我们对RTDETR的优化版本(主要是训练策略and部署方面的优化,模型结构和v1是一致的,可能叫v1.5更合适)。所以从创新的的角度,应该不会和你有冲突
  2. RTDETRv2模型本来是有开源的计划,但是由于缺少人手的问题目前未能开源,也未形成技术报告/论文(模型限内部使用,但是不排除之后会直接开源代码)
  3. 鉴于本discussionRTDETRv2 #179 已经存在的事实,建议你直接用v3,但是论文不需要和v2进行比较

如果有疑问和其他想法 欢迎继续讨论

@Peterande
Copy link

您好,请问v2有投稿意向吗?能得知大概会在什么时间范围内放出嘛? 我也有意向将RT-DETR这个IP做下去,像YOLO一样形成V2,V3....并且也取得了一些成果, 但似乎在您的官方v2发布前我无法擅自进行这种延续性的命名qwq

@Peterande 非常抱歉本issue名字给你带来的困扰

另外也非常高兴社区有RTDETR方向的优化,非常期待成果。( 这也是我们开源的目的之一 )

  1. RTDETRv2是我们刚发布v1之后的产物,是我们对RTDETR的优化版本(主要是训练策略and部署方面的优化,模型结构和v1是一致的,可能叫v1.5更合适)。所以从创新的的角度,应该不会和你有冲突
  2. RTDETRv2模型本来是有开源的计划,但是由于缺少人手的问题目前未能开源,也未形成技术报告/论文(模型限内部使用,但是不排除之后会直接开源代码)
  3. 鉴于本discussion (comming soon)已经存在的事实,建议你直接用v3,但是论文不需要和v2进行比较

如果有疑问和其他想法 欢迎继续讨论

非常感谢您的解答和分享!我已经明白了RTDETRv2的情况,也感谢您团队对社区的贡献和开源精神。

@lyuwenyu
Copy link
Owner Author

https://arxiv.org/abs/2407.17140

@Ryanshuai
Copy link

https://arxiv.org/abs/2407.17140

感谢感谢,现在就卡在 deformable attention,好多板子支持的不好。
感谢!

@defrag-bambino
Copy link

源代码什么时候到?

https://arxiv.org/abs/2407.17140

@babakbch
Copy link

babakbch commented Oct 2, 2024

Hi
How can I create a Confusion Matrix for my val/test set?

@imyhxy
Copy link

imyhxy commented Oct 8, 2024

你好,我使用rtdetv2_r18vd_120e_coco.yaml训练,最终结果为47.6,与论文中的48.1存在一定差距,请问有可能是什么原因。

这是训练命令:

export CUDA_VISIBLE_DEVICES=0,1,2,3

python -m torch.distributed.run \
  --master_port=9909 \
  --nproc_per_node=4 \
  tools/train.py \
  --config configs/rtdetrv2/rtdetrv2_r18vd_120e_coco.yml \
  --use-amp \
  --seed 0

这是训练记录:
log.txt

训练结果截图:
image

@lyuwenyu
Copy link
Owner Author

lyuwenyu commented Oct 17, 2024

@imyhxy 可以使用最新的torch版本再试一下, 这是48.1的log
https://github.com/lyuwenyu/storage/releases/download/v0.2/log_rtdetrv2_r18vd_120e_coco_rerun_48.1.txt

@lyuwenyu
Copy link
Owner Author

Hi How can I create a Confusion Matrix for my val/test set?

This repo has no relevant tools. You need to find third-party tools. @babakbch

@imyhxy
Copy link

imyhxy commented Oct 17, 2024

@lyuwenyu 我使用了torch 2.4.1来训练的,我也对比了提供日志中的超参数,和我训练的基本一致的,只有collate_fn有区别,日志是CollateFuncion,仓库里的配置是BatchImageCollateFuncion。

请问你使用了的pytorch,opencv,CUDA和cudnn版本是多少。

@lyuwenyu
Copy link
Owner Author

这些都没有记录 日志上传的时间是在8月份时候 torch应该是用的2.4吧。 不好意思 时间有点久了 机器已经释放了。 @imyhxy

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests