首页 > 专利技术

CVPR2021论文大盘点-行人技术篇

阅读：评论：0

CVPR2021论⽂⼤盘点-⾏⼈技术篇

本⽂总结CVPR 2021 ⾏⼈相关技术论⽂，包括⼈计数、⾏⼈检测跟踪、步态识别等。共计 7 篇。

⼤家可以在：

按照题⽬下载这些论⽂。

如果想要下载所有CVPR 2021论⽂，请点击这⾥：

拥挤⼈计数

Cross-Modal Collaborative Representation Learning and a Large-Scale RGBT Benchmark for Crowd Counting

当前的⼀些⼈计数⽅法多为只使⽤ RGB 图像的有限信息，对于⽆限制场景下的隐藏⾏⼈效果不好。双电源控制器

在本次的研究中，作者发现结合光学和热学信息可以⼤⼤有助于识别⾏⼈。为了促进这⼀领域的未来研究，该⽂引⼊⼤规模的 RGBT ⼈计数（RGBT-CC）基准，其中包含 2,030 对 RGB-热图像和138,389个标注的⼈。此外，为了促进多模态⼈计数，提出⼀个跨模态协同表征学习框架，它由多个特定模态分⽀、⼀个模态共享分⽀和⼀个信息聚合-分配模块（IADM）组成，以充分捕捉不同模态的互补信息。

数码锁

在 RGBT-CC 基准上进⾏的⼤量实验证明所提出框架对 RGBT ⼈计数的有效性。此外，所提出的⽅法对于多模态的⼈计数是通⽤的，并且能够在ShanghaiTechRGBD 数据集上取得优异的性能。

作者 | Lingbo Liu, Jiaqi Chen, Hefeng Wu, Guanbin Li, Chenglong Li, Liang Lin

单位 | 中⼭⼤学；琶洲实验室；安徽⼤学；DarkMatter AI Research

有预训练，98m：

Cross-View Cross-Scene Multi-View Crowd Counting

⽂章中提出⼀个跨视⾓跨场景（CVCS）的多视⾓⼈计数范式，其中训练和测试发⽣在具有任意摄像机布局的不同场景。

为了动态地处理在场景和相机布局变化以及由于相机校准错误或错误特征造成的⾮对应性噪声下的最佳视图融合的挑战。提出 CVCS 模型，利⽤相机布局的⼏何形状来仔细选择和融合多个视图，并采⽤噪声视图正则化⽅法来训练该模型以处理不对应的错误。还⽣成⼀个⼤型的合成多摄像机⼈计数数据集，其中有⼤量的场景和摄像机视⾓，⽤来捕捉更多可能的变化，避免了收集和标注这样⼀个⼤型真实数据集的困难。然后，通过使⽤⽆监督的域迁移，在真实的多视⾓计数数据集上测试所训练的 CVCS 模型。

在合成数据上训练的拟议的CVCS模型优于只在真实数据上训练的同⼀模型，并且与在同⼀单⼀场景上训练和测试的完全监督⽅法相⽐，取得不错的性能。

作者 | Qi Zhang、Wei Lin、Antoni B. Chan

单位 | ⾹港城市⼤学；西北⼯业⼤学

论⽂ |

A Generalized Loss Function for Crowd Counting and Localization

⽂章中提出⼀个⽤于⼈计数和定位的学习密度图的⼴义损失函数，它是基于⾮平衡最优传输的。并证明传统的 L2 和贝叶斯损失是该损失函数的特例和次优解。⼜提出⼀个视⾓引导的 cost function（成本函数）来处理⼈图像中的视⾓转换。在⼴泛的实验和⼤规模数据集上取得了卓越的性能。该⽂所提出的损失函数应⽤于⼈定位，在没有任何特殊设计的架构下取得了最佳性能。

飘窗的制作作者 | Jia Wan 、Ziquan Liu 、Antoni B. Chan

单位 | ⾹港城市⼤学

论⽂ |

⾏⼈检测

Variational Pedestrian Detection

⽂中将以独特的视⾓将⾏⼈检测作为⼀个 variational inference（变分推理）问题。通过将 dense proposals 建模为⼀个隐变量，同时提出⼀个定制的 Auto Encoding Variational Bayes（AEVB）算法，为⾏⼈检测制定了⼀个新颖有效的算法。

机控网

在 CrowdHuman 和 CityPersons 数据集上进⾏的实验表明，所提出的算法是处理单阶段检测器的密集⾏⼈检测问题的有效解决⽅案。并且该⽅法也可以灵活地应⽤于两阶段的检测器，实现明显的性能提升。

作者 | Yuang Zhang, Huanyu He, Jianguo Li, Yuxi Li, John See, Weiyao Lin

单位 | 上海交通⼤学；蚂蚁集团；赫瑞-⽡特⼤学

Generalizable Pedestrian Detection: The Elephant In The Room

这篇⽂章是不折不扣的⾏⼈检测学界“打脸⽂”，作者通过不同数据集的跨库评估研究现有⾏⼈检测算法的泛化性，发现结果并不如⼈意，这很可能因为1）算法设置针对特定数据集，2）训练源往往⾏⼈并不密集。有意思的是作者还发现那些并不是为⾏⼈检测设计的通⽤的⽬标检测⽅法泛化表现更好。

最后作者发明了⼀种渐进式的训练⽅法，取得了更好的跨库检测性能，并希望业界关注跨库测试。

（CV君：很明显在各个⽅向都需要这样的评估和研究）

作者 | Irtiza Hasan, Shengcai Liao, Jinpeng Li, Saad Ullah Akram, Ling Shao

单位 | IIAI；阿尔托⼤学

⾏⼈跟踪

Tracking Pedestrian Heads in Dense Crowd

在本⽂中，作者提出⼀个新的数据集：CroHD，其中有标注的⾏⼈头部，⽤于在密集的⼈中进⾏追

踪，并为 CroHD 提出⼀个基线头部检测器：HeadHunter，通过扩展 HeadHunter 作为 CroHD 的基线头部追踪器来开发 HeadHunter-T，提出⼀个新的指标，IDEucl，⽤于评估追踪器在代表ground truth 轨迹⽅⾯的效率，最后，通过与 CroHD 上现有的三个最先进的追踪器进⾏⽐较，证明 HeadHunter-T 是⼀个强⼤的基线。

h1n7作者 | Ramana Sundararaman, Cedric De Almeida Braga, Eric Marchand, Julien Pettre

单位 | Univ Rennes；

没有开源预训练。

步态识别

粘扣

Cross-View Gait Recognition with Deep Universal Linear Embeddings

在本次研究中，作者将 Koopman 理论引⼊到 gait silhouettes 的动态特征提取中。并且作者表⽰这是第⼀个应⽤ Koopman 分析的研究。通过整合卷积变分⾃动编码器和深度 Koopman 嵌⼊，提出⼀个新的跨视⾓步态识别框架。以及在⼀个⼴泛使⽤的⼤型步态数据库OU-MVLP 上进⾏了实验。结果证明了所提出⽅法的有效性，为理解步态识别和⼈类⾏⾛动态之间的联系做出了重要贡献。

作者 | Shaoxiong Zhang, Yunhong Wang, Annan Li

单位 | 北航

论⽂ |

本文发布于:2023-05-24 12:40:13，感谢您对本站的认可！

本文链接：https://patent.en369.cn/patent/3/112294.html

上一篇：计算机视觉与机器学习在人脸识别中的应用

下一篇：人脸识别技术