Deformable DETR使用two-stage的代码疑惑
开心生活没一天:
哥,我还有个问题,这里提取候选框是怎么提取的,rpn不是类似ssd,直接在对应的像素点预测该像素在原图生成的锚框吗,这里为啥要把候选框对应的区域特征图收集起来,这样看起来像fast rcnn。
RT-DETR代码详解(官方pytorch版)——参数配置(1)
@涬的猫z:
这个解决了吗求
《Fusion-Mamba for Cross-modality Object Detection》论文精读笔记
2301_81898778:
为什么论文里面 Table 3 的两个对比模型YOLOv8l-IR和YOLOv8l-RGB的参数都是76.7M,标准的单模态yolov8-l不是43.7M参数吗?
Deformable DETR使用two-stage的代码疑惑
小小老大MUTA️:
建议看看conditinal detr 和 DAB这两篇论文,能方便理解区分。推荐:https://blog.csdn.net/jiaoyangwm/article/details/132431252 https://zhuanlan.zhihu.com/p/560513044 这两篇博文
Deformable DETR使用two-stage的代码疑惑
小小老大MUTA️:
我理解的就是dert,和deformable detr这两个只是在代码中区分了tgt和query_pos,但是没做理论上的解释。到conditional detr这里论文中才从理论上正式把query分为content 和 position,然后DAB又基于conditional detr,指出conditional detr虽然加入了位置先验,但是忽略尺寸,然后DAB又在位置先验的基础上又加上了尺度信息。