文 转 自 机 器 之 心
行人图像的姿势变化是行人重识别(reID)任务中的重要挑战之一。本文提出了一个 reID 新框架——FD-GAN,来学习与身份相关而与姿势无关的表征,用于姿势不同的行人重识别。与现有的对齐或基于区域的学习方法相比,该框架不需要额外的辅助姿势信息和计算成本,在三个广泛使用的行人重识别数据集中都取得了当前最优结果。
本文提出的特征提取生成式对抗网络(FD-GAN)在姿势改变的情况下还能保持身份特征的连续性(如图 1 所示),但推断复杂性并没有增加。该架构采用了 Siamese 架构学习特征。每一个分支中都有一个图像编码器和图像生成器。图像编码器输入给定输入图像中的行人视觉特征。图像生成器根据姿势信息和编码器中输入的行人特征生成了新的行人图像。框架中集成了多个判别器,分辨通过两个分支生成的图像之间的分支内和分支间关系。
图 1:在姿势引导的图像生成器和判别器的帮助下训练得到的 FD-GAN 中的图像编码器,以学习鲁棒的身份相关和姿势相关表征。它在推断时不需要姿势信息和额外的计算成本。
身份判别器、姿势判别器和验证分类器连同重建损失以及全新的同姿势损失一起正则化特征学习过程,来实现鲁棒的行人重识别。根据对抗损失,可以通过图像编码器在视觉特征中减少姿势和背景这种与身份判断无关的信息。更重要的是,在推断过程中,不再需要额外的姿势信息以及额外的计算成本。在三个广泛使用的 reID 数据集(即 Market-1501[5]、CUHK03[6] 和 DukeMTMC-reID[7])中,我们的方法比之前的方法都要好。
总体而言,本研究做出了以下贡献:1)我们提出了一个新的框架,FD-GAN,来学习与身份相关而与姿势无关的表征,用于姿势不同的行人重识别。与现有的对齐或基于区域的学习方法不同,我们的框架不需要额外的辅助姿势信息,在推断过程中也不需要增加计算的复杂程度。2)尽管在我们的框架中,行人图像生成是辅助任务,但是通过该框架生成的行人图像的质量比现有的行人图像生成方法所生成的图像都要好。3)在行人重识别任务中,本文提出的 FD-GAN 在 Market-1501[5],CUHK03[6] 以及 DukeMTMC-reID[7] 数据集上都取得了当前最佳的表现。
图 2:FD-GAN 的 Siamese 架构。利用验证损失,通过图像编码器 E 学习鲁棒的身份相关而姿势无关的特征,而生成假图像的辅助任务是为了骗过身份和姿势判别器的。引入新的同姿势损失项是为了进一步促进对与身份相关而与姿势无关的视觉特征的学习。
论文:FD-GAN: Pose-guided Feature Distilling GAN for Robust Person Re-identification
论文链接:https://arxiv.org/pdf/1810.02936v1.pdf
更多HKSAIR及行业资讯,敬请关注香港人工智能与机器人学会公众号