论文题目:Do We Really Need Frame-by-Frame Annotation Datasets for object tracking?
作者:Lei Hu, Shaoli Huang, Shilei Wang, Wei Liu, Jifeng Ning(通讯作者)
会议名称:ACM Conference on Multimedia(中国计算机学会A类会议)
发表时间:2021年10月
论文简介:
近日,太阳成集团tyc138宁纪锋教授课题组在2021年多媒体领域顶级会议ACM Conference on Multimedia(中国计算机学会A类会议)发表题为“Do We Really Need Frame-by-Frame Annotation Datasets for object tracking?”的研究论文,接收类型为oral。我校硕士生胡磊为第1作者,澳大利亚悉尼大学黄少立博士为共同1作,宁纪锋教授为论文通讯作者。
最近跟踪领域的研究越来越重视构建大规模跟踪数据集,并将其作为基于深度学习的跟踪 器成功的驱动因素。然而,准确地标注跟踪数据是高强度且昂贵的,这将限制其在实际中的应用。此次发表的研究论文首次探索了在小规模数据集上训练高性能跟踪算法的可行性。
论文引入了一个FAT (few -annotation Tracking)基准,它从一些现有的跟踪数据集中对每个视频采样一帧或几帧来构造,用于评估跟踪算法的有效性。进一步,提出了通过模拟运动变化的数据增强策略(AMMC),使用小规模数据集学习高性能跟踪 器具有可行性。与标准的增强方法相比,AMMC考虑了跟踪数据的特点用以合成更有效的数据。论文使用FAT数据集,在两个代表性跟踪 器上评估了跟踪算法的性能。实验表明,利用本文的方法,跟踪 器仅在少量注释的数据集上训练,可达到与大规模全标注数据集相当甚至更好的性能。论文研究表明,如果在训练中利用运动驱动的数据增强,那么完整的视频标注对于目标跟踪可能是不必要的。
论文链接:https://doi.org/10.1145/3474085.3475365