人类动作识别与定位视频剪辑与片段数据集2019-pypiahmad
数据来源:互联网公开数据
标签:HACS,动作识别,视频数据集,时间定位,计算机视觉,动作剪辑,动作片段,SLAC,学术研究,数据科学
数据概述:
HACS数据集是一个专为动作识别和时间定位设计的新型视频数据集,包含两种类型的手动注释:
HACS剪辑:包含155万个2秒的剪辑注释。
HACS片段:包含5万个视频的完整动作片段(从动作开始到结束)注释。
该数据集被认为在预训练动作识别和定位模型方面具有有效性,并且为时间动作定位树立了新的基准。SLAC数据集已合并到HACS数据集中。
数据集组成:
数据集由训练集、验证集和测试集组成,具体统计如下:
剪辑:
训练集:492,748个视频,包含1,509,478个剪辑。
验证集:5,981个视频,包含20,245个剪辑。
测试集:5,987个视频,包含20,293个剪辑。
片段:
训练集:37,613个视频。
验证集:5,981个视频。
测试集:5,987个视频。
注释文件格式:
对于HACS剪辑,注释文件采用CSV格式,每条记录包含类别名、YouTube ID、子集、起止时间以及正负样本标签。
对于HACS片段,注释文件采用JSON格式,类似于ActivityNet数据集,包含标签、片段时间、子集、视频时长及视频链接等详细信息。
视频下载:
可以使用提供的脚本download_videos.py下载视频。默认情况下,视频短边调整为256像素以减少磁盘使用,可进行调整。
缺失视频和测试视频:
对于缺失视频或需要完整测试视频,可通过提供的请求表提交请求,视频链接将在72小时内发送。
许可协议:
该数据集采用BSD-3-Clause许可证,允许在遵守许可条款的前提下使用和分发。
引用:
如使用该数据集,建议引用以下论文:
@inproceedings{zhao2019hacs,
title={Hacs: Human action clips and segments dataset for recognition and temporal localization},
author={Zhao, Hang and Torralba, Antonio and Torresani, Lorenzo and Yan, Zhicheng},
booktitle={Proceedings of the IEEE International Conference on Computer Vision},
pages={86688678},
year={2019}
}
附加资源:
项目网站
论文