Skip to content

Latest commit

 

History

History
19 lines (16 loc) · 1.3 KB

detr.md

File metadata and controls

19 lines (16 loc) · 1.3 KB

object detection

论文来自:https://zhuanlan.zhihu.com/p/388975066

up-detr(unsupervised-pretrained-detection-transformer):

detr:

  • https://medium.com/@faheemrustamy/detection-transformer-detr-vs-yolo-for-object-detection-baeb3c50bc3
  • backbone:删去fc层(全连接)的resnet50,因为要换头,先提取图像的特征
  • 然后再转换成transformer的输入格式,输入transformer(理解图像不同区域之间的关系(attention))使用自注意力机制(捕捉输入数据不同部分的关系,并给不同部分打分)
  • 位置编码(cnn具有空间感知能力但transformer没有)告诉transformer特征对应的位置
  • 预测head:类别预测和框预测

ore(open world object detection):

  • 检测出unknown目标;且不忘记之前学到的目标
  • 基于faster-rcnn