继在三大主流单帧图片行人再识别数据集(Market1501,DukeMTMC-reID,CUHK03)刷新世界纪录后,近日,澎思科技(Pensees)在基于视频的行人再识别数据集(PRID-2011,iLIDS-VID,MARS)中再次取得突破性进展,并在三大数据集上实现算法关键指标首位命中率(Rank-1 Accuracy)大幅度提升,准确率创历史新高。
实现关键指标提升,新算法刷新三大数据集世界纪录
PRID-2011、iLIDS-VID 和 MARS 均为基于视频的行人再识别数据集。PRID-2011 数据集中的视频对通过两个固定的监控摄像头进行采集,摄像头 A 包含 385 个行人,摄像头 B 包含 749 个行人。这些行人中,只有 200 个行人同时出现在两个摄像头中。iLIDS-VID 是在 PRID-2011 之后公布的数据集,与 PRID-2011 相比,数据更加整齐,也更有挑战性。iLIDS-VID 数据集是通过机场到达大厅的 CCTV 监控视频采集得到的,包含 300 个行人在两个摄像头下的 600 段视频。视频中存在严重的着装相似,光照和视角变化,复杂背景和遮挡现象,因此识别难度大。MARS 数据集是目前基于视频 ReID 最大的数据集,是单帧图片行人再识别数据集 Market1501 的扩充版,图像数量由 32,668 幅扩展到了 1,191,003 幅。
与单帧图片的行人再识别数据集一样,首位命中率(Rank-1 Accuracy)和平均精度均值(Mean Average Precision,mAP)是衡量视频行人再识别 ReID 算法水平的核心指标。澎思科技此次一举实现在三大数据库上,仅利用原始数据就实现 Rank-1 Accuracy 关键指标大幅度提升。 目前,澎思科技算法在最大的视频数据集 MARS 上的首位命中率指标已经达到 88.8%,领先香港中文大学、中科大、北京大学等国内外知名机构。在 iLIDS-VID 和 PRID-2011 等数据集上首位命中率也分别达到了 88.0%和 95.5%。
澎思科技行人再识别 ReID 算法在 MARS 数据集的部分测试结果
新算法立足于现实场景
澎思科技此次成果的取得源于澎思新加坡研究院对算法的自研创新和融合探索,是立足于澎思现有业务和商业模式,结合公司的发展方向针对性开展垂直领域技术研发和创新。主要包括以下几个方面:
基于视频的行人再识别与单帧图片的行人再识别任务目的是相同的,即在视角不重叠的多摄像机网络下进行行人的匹配。尽管基于单帧图片的行人再识别算法已经取得了不错的进步,但由于单帧图片只包含有限的行人信息,网络提取的特征不具备足够的代表性,检测结果往往受图片质量的影响较大。
与此相比,视频序列的优势便凸显出来。一个短视频序列往往包含行人多运动状态下的更多特征,并且利用时序信息,可以将背景、遮挡等干扰因素的影响降到最低,提升识别的准确度。
基于视频的行人再识别(ReID)技术更贴近智慧城市建设的诸多应用场景,能有效解决行人信息有限、特征不足及其他干扰因素等问题,相比单帧图片的行人再识别具备更长远的落地应用空间。接下来,澎思科技将进一步加大在视频行人再识别算法上的研究,并逐步将算法应用到平安城市、智慧社区、智慧园区、智慧零售、智慧交通等实战应用场景中。