fucda手表价格

2023-01-05 02:36:29 发布:网友投稿作者：网友投稿

热度:91

整理：CV君

继目标检测篇之后，继续总结目标检测相关论文，包含无监督域适应、小样本、跨域、端到端、单阶、多目标、半监督等目标检测。共计 28 篇。

大家可以在：

https://openaccess.thecvf.com/CVPR2021?day=all

按照题目下载这些论文。

如果想要下载所有CVPR 2021论文，请点击这里：

CVPR 2021 论文开放下载了！

无监督域适应目标检测

MeGA-CDA: Memory Guided Attention for Category-Aware Unsupervised Domain Adaptive Object Detection

文章中提出 memory-guided attention maps，用于实现域适应目标检测的类别分布匹配，此外，采用基于度量学习的方法计算类别特定的注意力maps，来提高记忆模块的有效性。在几个基准数据集上的评估显示，以极大的优势优于近期的域适应检测方法。

作者 | Vibashan VS, Poojan Oza, Vishwanath A. Sindagi, Vikram Gupta, Vishal M. Patel

单位 | 约翰斯霍普金斯大学；MBRDI

论文 | https://arxiv.org/abs/2103.04224

Domain-Specific Suppression for Adaptive Object Detection

提出 domain-specific suppression 用于无监督域适应目标检测，比最先进的方法有明显改进，在所有这些域适应性场景中，MAP表现出10.2∼12.2% 的提升。

作者 | Yu Wang, Rui Zhang, Shuo Zhang, Miao Li, YangYang Xia, XiShan Zhang, ShaoLi Liu

单位 | 中科院；寒武纪；国科大

论文 | https://arxiv.org/abs/2105.03570

跨域弱监督目标检测

Informative and Consistent Correspondence Mining for Cross-Domain Weakly Supervised Object Detection

文中提出两个新模块：Informative Correspondence Mining（ICM）和 Correspondence Mining（CCM），用来解决跨域弱监督目标检测。前者为局部语义迁移找到了信息丰富的跨域对应关系，而CCM将循环学习作为一致性正则器。在各种数据集上的实验表明，所提出的方法与现有的方法相比，取得了相当大的改进。

作者 | Luwei Hou, Yu Zhang , Kui Fu, Jia Li

单位 | 北航；鹏城实验室；商汤

论文 | https://openaccess.thecvf.com/content/CVPR2021/papers/Hou_Informative_and_Consistent_Correspondence_Mining_for_Cross-Domain_Weakly_Supervised_Object_CVPR_2021_paper.pdf

备注 | CVPR 2021 oral

端到端目标检测

Sparse R-CNN: End-to-End Object Detection with Learnable Proposals

Sparse R-CNN 在具有挑战性的 COCO 数据集上被证实具有与成熟检测器基线相当的精度、运行时间和训练收敛性能，例如，在标准的 3× 训练计划中实现了 44.5 AP，使用 ResNet-50 FPN 模型可以以 22 fps 的速度运行。

作者 | Peize Sun, Rufeng Zhang, Yi Jiang, Tao Kong, Chenfeng Xu, Wei Zhan等

单位 | 香港大学；同济大学；字节跳动；伯克利

论文 | https://arxiv.org/abs/2011.12450

代码 | https://github.com/PeizeSun/SparseR-CNN

End-to-End Object Detection with Fully Convolutional Network

作者 | Jianfeng Wang, Lin Song, Zeming Li, Hongbin Sun, Jian Sun, Nanning Zheng

单位 | 旷视；西安交通大学

论文 | https://arxiv.org/abs/2012.03544

代码 | https://github.com/Megvii-BaseDetection/DeFCN

解读 | https://zhuanlan.zhihu.com/p/332281368

Instant-Teaching: An End-to-End Semi-Supervised Object Detection Framework

InstantTeaching，是一个完全端到端的、有效的 SSOD 框架，在每次训练迭代中使用即时伪标注和扩展的弱-强数据增量进行教学。通过进一步提出基于InstantTeaching 的协同纠正方案，Instant-Teaching，来缓解确认偏差问题，提高伪标注的质量。

在 MS-COCO 和 PASCAL VOC 数据集上的实验证明了所提出框架的优越性。如，当使用 2% 的标记数据时，所提出方法在 MS-COCO 上超过了最先进的方法 4.2 mAP。即使有 MS-COCO 的全部监督信息，仍然比最先进的方法高出约 1.0 mAP。在 PASCAL VOC 上，通过应用 VOC07 作为标记数据和 VOC12 作为无标记数据，可以实现超过 5mAP 的改进。

作者 | Qiang Zhou, Chaohui Yu, Zhibin Wang, Qi Qian, Hao Li

单位 | 阿里

论文 | https://openaccess.thecvf.com/content/CVPR2021/papers/Zhou_Instant-Teaching_An_End-to-End_Semi-Supervised_Object_Detection_Framework_CVPR_2021_paper.pdf

One-Stage目标检测

I^3Net: Implicit Instance-Invariant Network for Adapting One-Stage Object Detectors

Implicit Instance-Invariant Network（I3Net）是为适应 one-stage 检测器而制定，并通过利用不同层的深度特征的自然特性来隐式学习实例不变的特征。实验表明，I3Net 在基准数据集上的性能超过了最先进水平。

作者 | Chaoqi Chen, Zebiao Zheng, Yue Huang, Xinghao Ding, Yizhou Yu

单位 | 香港大学；厦门大学；Deepwise AI Lab

论文 | https://arxiv.org/abs/2103.13757

多目标检测与跟踪

There is More than Meets the Eye: Self-Supervised Multi-Object Detection and Tracking with Sound by Distilling Multimodal Knowledge

通过蒸馏多模态知识用声音进行自监督的多目标检测和跟踪

作者 | Francisco Rivera Valverde, Juana Valeria Hurtado, Abhinav Valada

单位 | University of Freiburg

论文 | https://arxiv.org/abs/2103.01353

open-vocabulary 目标检测

Open-Vocabulary Object Detection Using Captions

本文中对目标检测问题提出新的表述：open-vocabulary object detection，比弱监督和零样本方法更普遍、更实用、更有效。并提出一种新的方法 OVR-CNN，利用有限的物体类别的边界框标注来训练目标检测器，以及涵盖更多种类物体的 image-caption 对，而且成本明显降低。

实验结果表明，所提出的方法可以检测和定位在训练期间没有提供边界框标注的物体，其准确度明显高于零样本方法。同时，有边界框标注的物体检测精度几乎与监督方法一样，明显优于弱监督的基线。因此，为可扩展的目标检测建立了一个新的 SOTA。

作者 | Alireza Zareian, Kevin Dela Rosa, Derek Hao Hu, Shih-Fu Chang

单位 | Snap Inc；哥伦比亚大学

论文 | https://arxiv.org/abs/2011.10678

代码 | https://github.com/alirezazareian/ovr-cnn

备注 | CVPR 2021 oral

基于 ranking 的目标检测

RankDetNet: Delving into Ranking Constraints for Object Detection

提出一个基于 ranking 的目标检测的优化算法，并有 global ranking, class-specific ranking 和 IoU-guided ranking losses 三种 ranking 约束。

实验表明，RankDetNet 可以持续改善最先进的基于锚点和无锚点的二维检测基线和三维检测方法，并证明该方法的优越性和通用性。

作者 | Ji Liu, Dong Li, Rongzhang Zheng, Lu Tian, Yi Shan

单位 | 赛灵思

论文 | https://openaccess.thecvf.com/content/CVPR2021/papers/Liu_RankDetNet_Delving_Into_Ranking_Constraints_for_Object_Detection_CVPR_2021_paper.pdf

跨域目标检测

Unbiased Mean Teacher for Cross-domain Object Detection

本次工作中，作者通过利用检测模型容易对源图像产生偏差这一视角对跨域目标检测这一问题进行了研究。提出 Unbiased Mean Teacher（UMT），通过设计三种非常有效的策略来弥补模型的偏差。具体来说，先引入 cross-domain 蒸馏，以最大限度地利用教师模型的专业知识；然后，通过像素级的适应来进一步增加学生模型的训练样本，以减少其模型偏差；最后，利用 out-of-distribution 估计策略，选择最适合当前模型的样本来加强跨域蒸馏过程。

实验结果表明，UMT 以相对较大的幅度超过了现有的最先进的模型。如，在基准数据集 Clipart1k、Watercolor2k、Foggy Cityscapes 和 Cityscapes上的 mAPs 分别达到了 44.1%、58.1%、41.7% 和 43.1%。

作者 | Jinhong Deng, Wen Li, Yuhua Chen, Lixin Duan

单位 | 电子科技大学；苏黎世联邦理工学院

论文 | https://arxiv.org/abs/2003.00707

代码 | https://github.com/kinredon/umt

RPN Prototype Alignment for Domain Adaptive Object Detector

文中提出一种用于跨域目标检测的新型 RPN 原型对齐方法，它强制两个域的 RPN 特征分别与前景和背景的可学习原型对齐。具体来说，提出一种简单而有效的伪标签生成方法来指导目标域中 RPN 特征的学习。此外，为了提高前景 RPN 特征的可辨别性，作者提出从 RPC 中生成注意力图来对 RPN 特征进行空间调制。

对不同场景的综合实验都验证了所提出方法的有效性。

作者 | Yixin Zhang ，Zilei Wang， Yushi Mao

单位 | 中国科学技术大学

论文 | https://openaccess.thecvf.com/content/CVPR2021/papers/Zhang_RPN_Prototype_Alignment_for_Domain_Adaptive_Object_Detector_CVPR_2021_paper.pdf

半监督目标检测

Interpolation-based semi-supervised learning for object detection

文中提出基于 Interpolation 的用于目标检测的半监督学习方法，（ISD）。考虑并解决了由传统的插值正则化（IR）直接应用于目标检测所引起的问题。

实验证明，在监督学习环境中，所提出方法以很大的幅度提高了基准方法。在半监督学习环境中，该算法提高了基准架构（SSD）中基准数据集（PASCAL VOC和MSCOCO）的性能。

作者 | Jisoo Jeong, Vikas Verma, Minsung Hyun, Juho Kannala, Nojun Kwak

单位 | 首尔大学等

论文 | https://arxiv.org/abs/2006.02158

代码 | https://github.com/soo89/ISD-SSD

Data-Uncertainty Guided Multi-Phase Learning for Semi-Supervised Object Detection

本文为半监督目标检测提出 data uncertainty guided multi-phase 学习方法。可以使模型充分利用所有的信息和不确定性描述指导训练过程，使检测器集中于某些知识。在 PASCAL VOC 和 MS COCO 数据集上结果达到 78.6%和 42.3%，分别超过最先进方法的 2.4% 和 2.2%。

作者 | Zhenyu Wang, Yali Li, Ye Guo, Lu Fang, Shengjin Wang

单位 | 清华大学

论文 | https://arxiv.org/abs/2103.16368

Points as Queries: Weakly Semi-supervised Object Detection by Points

文中提出 Point DETR，在 COCO 数据集上，仅使用 20% 完全标注的数据，检测器可达 33.3AP，超过基线 2.0AP。

作者 | Liangyu Chen、Tong Yang、Xiangyu Zhang、Wei Zhang、Jian Sun

单位 | 旷视】复旦大学

论文 | https://openaccess.thecvf.com/content/CVPR2021/papers/Chen_Points_As_Queries_Weakly_Semi-Supervised_Object_Detection_by_Points_CVPR_2021_paper.pdf

简介 | 第六条

Interactive Self-Training with Mean Teachers for Semi-supervised Object Detection

文中提出一种交互式的自训练形式框架，使用 mean teachers 进行半监督的目标检测。可以避免过度拟合，提高半监督目标检测的伪标签质量。并在MS-COCO 和 PASCAL-VOC上的实验结果验证它的有效性。

作者 | Qize Yang, Xihan Wei, Biao Wang, Xian-Sheng Hua, Lei Zhang

单位 | 阿里；香港理工大学

论文 | https://openaccess.thecvf.com/content/CVPR2021/papers/Yang_Interactive_Self-Training_With_Mean_Teachers_for_Semi-Supervised_Object_Detection_CVPR_2021_paper.pdf

Humble Teachers Teach Better Students for Semi-Supervised Object Detection

文中提出 humble teacher 方法用于半监督目标检测，在低数据和高数据状态下都优于以前的最先进水平。

作者 | Yihe Tang、 Weifeng Chen、Yijun Luo 、Yuting Zhang

单位 | 卡内基梅隆大学；亚马逊

论文 | https://openaccess.thecvf.com/content/CVPR2021/papers/Tang_Humble_Teachers_Teach_Better_Students_for_Semi-Supervised_Object_Detection_CVPR_2021_paper.pdf

弱监督目标定位

Shallow Feature Matters for Weakly Supervised Object Localization

弱监督目标定位（WSOL）旨在仅利用图像级别的标签来定位目标。 CAMs 是实现 WSOL 的常用特征。但以前基于 CAM 的方法并没有充分利用shallow 特征，尽管它们对WSOL很重要。因为通过传统的融合，shallow 特征很容易被埋没在背景噪声中。

文中提出 Shallow feature-aware Pseudo supervised Object Localization（SPOL）模型，用于准确的 WSOL，它充分利用了嵌入浅层的低层次特征。进一步提出 Gaussian prior pseudo label（GPPL）和类别无关的分割模型，以实现 WSOL 的更好的目标掩码。

实验结果表明，SPOL 在 CUB200 和 ImageNet-1K 基准上的表现超过了最先进的水平，分别达到了 93.44% 和 67.15%（即3.93%和2.13%的提高）的Top-5 定位精度。

作者 | Jun Wei，Qin Wang，Zhen Li，Sheng Wang，S.Kevin Zhou， Shuguang Cui

单位 | 香港中文大学(深圳)；深圳市大数据研究院；中国科学技术大学；中科院；南方科技大学

论文 | https://openaccess.thecvf.com/content/CVPR2021/papers/Wei_Shallow_Feature_Matters_for_Weakly_Supervised_Object_Localization_CVPR_2021_paper.pdf

Unveiling the Potential of Structure Preserving for Weakly Supervised Object Localization

基于结构信息保持的弱监督目标定位

作者 | Xingjia Pan, Yingguo Gao, Zhiwen Lin, Fan Tang, Weiming Dong, Haolei Yuan, Feiyue Huang, Changsheng Xu

单位 | 腾讯优图；吉林大学；中科院等

论文 | https://arxiv.org/abs/2103.04523

代码 | https://github.com/Panxjia/SPA_CVPR2021

简介 | 13

Strengthen Learning Tolerance for Weakly Supervised Object Localization

文中提出一种新型的分离式定位分类方法 SLT-Net，用于弱监督目标定位。 SLT-Net 通过加强对语义错误和数据分布多样性的学习容忍度来提高定位性能。提出 class-tolerance 分类模块，以加强对语义分类错误的容忍度，它可以通过减少类似类别中错误分类的惩罚来缓解部分支配问题。通过将转换后的图像的视觉反应图与原始图像的视觉反应图相匹配，加强对图像多样性的容忍度。

在细粒度数据集 CUB 和大规模数据集 ILSVRC2012 上进行的实验证明了所提方法的有效性。

作者 | Guangyu Guo, Junwei Han, Fang Wan, Dingwen Zhang

单位 | 西北工业大学；国科大

论文 | https://openaccess.thecvf.com/content/CVPR2021/papers/Guo_Strengthen_Learning_Tolerance_for_Weakly_Supervised_Object_Localization_CVPR_2021_paper.pdf

主页 | https://nwpu-brainlab.gitee.io/index_en

密集目标检测

Generalized Focal Loss V2: Learning Reliable Localization Quality Estimation for Dense Object Detection

作者 | Xiang Li, Wenhai Wang, Xiaolin Hu, Jun Li, Jinhui Tang, Jian Yang

单位 | 南京理工大学；Momenta；南京大学；清华大学

论文 | https://arxiv.org/abs/2011.12885

代码 | https://github.com/implus/GFocalV2

解读 | 目标检测无痛涨点之 Generalized Focal Loss V2

VarifocalNet: An IoU-aware Dense Object Detector

作者 | Haoyang Zhang, Ying Wang, Feras Dayoub, Niko Sünderhauf

单位 | 昆士兰科技大学；昆士兰大学

论文 | https://arxiv.org/abs/2008.13367

代码 | https://github.com/hyz-xmaster/VarifocalNet

备注 | CVPR 2021 oral

Beyond Bounding-Box: Convex-hull Feature Adaptation for Oriented and Densely Packed Object Detection

提出 convex-hull representation，通过可学习的特征配置检测不规则形状和/或布局的物体。又提出 convex-hull feature adaptation（CFA）方法，结合了 CIoU 和 feature antialiasing strategies，以及定义一种系统的方法来检测定向和密集的物体。

在 DOTA 和 SKU110KR 数据集上的实验表明，CFA 明显优于基线方法，取得了新的最先进检测性能。

作者 | Zonghao Guo, Chang Liu, Xiaosong Zhang, Jianbin Jiao, Xiangyang Ji,Qixiang Ye

单位 | 国科大；清华

论文 | https://openaccess.thecvf.com/content/CVPR2021/papers/Guo_Beyond_Bounding-Box_Convex-Hull_Feature_Adaptation_for_Oriented_and_Densely_Packed_CVPR_2021_paper.pdf

无监督目标检测

Unsupervised Object Detection With LIDAR Clues

作者 | Hao Tian, Yuntao Chen, Jifeng Dai, Zhaoxiang Zhang, Xizhou Zhu

单位 | 商汤；中国科学院大学等

论文 | https://openaccess.thecvf.com/content/CVPR2021/papers/Tian_Unsupervised_Object_Detection_With_LIDAR_Clues_CVPR_2021_paper.pdf

伪装目标检测

Mutual Graph Learning for Camouflaged Object Detection

问题：对于目前的模型来说，自动检测/分割与周围环境融为一体的物体是非常困难的。一个主要原因是前景物体和背景环境之间的内在相似性使得深度模型所提取的特征无法区分。

方案：设计了 Mutual Graph Learning（MGL）模型，将传统的相互学习理念从常规的网格推广到图域。具体来说，MGL 将一幅图像解耦为两个特定任务的特征图：一个用于大致定位，另一个用于准确捕捉其边界细节，并通过图形对它们的高阶关系进行反复推理，充分挖掘它们的相互优势。重要的是，与大多数使用共享函数来模拟所有任务间互动的相互学习方法相比，MGL配备了处理不同互补关系的类型化函数，以最大化信息互动。

结果：在包括 CHAMELEON、CAMO 和 COD10K 上的实验，证明了 MGL 的有效性，以及其性能优于现有的先进方法。

作者 | Qiang Zhai, Xin Li, Fan Yang, Chenglizhao Chen, Hong Cheng, Deng-Ping Fan

单位 | 电子科技大学；G42；青岛大学；IIAI

论文 | https://arxiv.org/abs/2104.02613

代码 | https://github.com/fanyang587/MGL

玻璃表面检测

Rich Context Aggregation With Reflection Prior for Glass Surface Detection

文中提出一个新模型，用于 glass surface detection。它由两个模块组成：一个是 Rich Context Aggregation Module (RCAM)，用于多尺度边界特征提取；另一个是 Reflection-based Refinement Module (RRM)，用于提取玻璃反射。并构建了一个具有挑战性的玻璃表面数据集，由 4,012 张来自不同的场景带有玻璃表面掩膜的真实世界图像组成。

实验表明，所提出的模型优于相关领域的最先进方法。

作者 | Jiaying Lin ，Zebang He ，Rynson W.H. Lau

单位 | 香港城市大学

论文 | https://openaccess.thecvf.com/content/CVPR2021/papers/Lin_Rich_Context_Aggregation_With_Reflection_Prior_for_Glass_Surface_Detection_CVPR_2021_paper.pdf

阴影检测

Single-Stage Instance Shadow Detection with Bidirectional Relation Learning

Instance Shadow Detection 的目的是找到 shadow instances, object instances 和 shadow-object 的关联，在光向估计和照片编辑中都有应用。

文中提出一个单阶全卷积网络架构，其中有一个双向关系学习模块，以端到端的方式直接学习阴影和物体实例的关系。

并在基准数据集上对该方法进行了评估，结果表明，优于最先进的方法。

作者 | Tianyu Wang, Xiaowei Hu, Chi-Wing Fu、Pheng-Ann Heng

单位 | 港中文；中科院

论文 | https://openaccess.thecvf.com/content/CVPR2021/papers/Wang_Single-Stage_Instance_Shadow_Detection_With_Bidirectional_Relation_Learning_CVPR_2021_paper.pdf

代码 | https://github.com/stevewongv/SSIS

备注 | CVPR 2021 Oral

Triple-cooperative Video Shadow Detection

本次的研究工作共有两个贡献。其一是收集了一个学习型视频阴影检测（ViSha）数据集，其中包含 120 个视频，11,685 帧，涵盖各种物体和场景，具有像素级的阴影标注。其二是开发了一个用于视频阴影检测的新型网络，通过学习阴影的视频内和视频间的鉴别特性。

实验证明所提出方法始终比 12 种最先进的方法有很大的优势。并且作者称是个用于视频阴影检测的标注数据集，ViSha 数据集可以促进视频阴影检测的进一步研究。

作者 | Zhihao Chen, Liang Wan, Lei Zhu, Jia Shen, Huazhu Fu, Wennan Liu, Jing Qin

单位 | 天津大学；剑桥大学；起源人工智能研究院；香港理工大学

论文 | https://arxiv.org/abs/2103.06533

代码 | https://github.com/eraserNut/ViSha

- END -

编辑：CV君

转载请联系本公众号授权

下一篇：驾驶证的照片可以换吗(驾驶证照片模板)
上一篇：胃出血做手术要多少钱(胃出血手术一般要做多久)

fucda手表价格

无监督域适应目标检测

跨域弱监督目标检测

端到端目标检测

One-Stage目标检测

多目标检测与跟踪

open-vocabulary 目标检测

基于 ranking 的目标检测

跨域目标检测

半监督目标检测

弱监督目标定位

密集目标检测

无监督目标检测

伪装目标检测

玻璃表面检测

阴影检测

相关信息

相关推荐

今日热点