人类动作识别与定位视频剪辑与片段数据集2019-pypiahmad

人类动作识别与定位视频剪辑与片段数据集2019-pypiahmad 数据来源:互联网公开数据 标签:HACS,动作识别,视频数据集,时间定位,计算机视觉,动作剪辑,动作片段,SLAC,学术研究,数据科学

数据概述: HACS数据集是一个专为动作识别和时间定位设计的新型视频数据集,包含两种类型的手动注释:

HACS剪辑:包含155万个2秒的剪辑注释。 HACS片段:包含5万个视频的完整动作片段(从动作开始到结束)注释。

该数据集被认为在预训练动作识别和定位模型方面具有有效性,并且为时间动作定位树立了新的基准。SLAC数据集已合并到HACS数据集中。

数据集组成: 数据集由训练集、验证集和测试集组成,具体统计如下:

剪辑: 训练集:492,748个视频,包含1,509,478个剪辑。 验证集:5,981个视频,包含20,245个剪辑。 测试集:5,987个视频,包含20,293个剪辑。

片段: 训练集:37,613个视频。 验证集:5,981个视频。 测试集:5,987个视频。

注释文件格式: 对于HACS剪辑,注释文件采用CSV格式,每条记录包含类别名、YouTube ID、子集、起止时间以及正负样本标签。 对于HACS片段,注释文件采用JSON格式,类似于ActivityNet数据集,包含标签、片段时间、子集、视频时长及视频链接等详细信息。

视频下载: 可以使用提供的脚本download_videos.py下载视频。默认情况下,视频短边调整为256像素以减少磁盘使用,可进行调整。

缺失视频和测试视频: 对于缺失视频或需要完整测试视频,可通过提供的请求表提交请求,视频链接将在72小时内发送。

许可协议: 该数据集采用BSD-3-Clause许可证,允许在遵守许可条款的前提下使用和分发。

引用: 如使用该数据集,建议引用以下论文: @inproceedings{zhao2019hacs, title={Hacs: Human action clips and segments dataset for recognition and temporal localization}, author={Zhao, Hang and Torralba, Antonio and Torresani, Lorenzo and Yan, Zhicheng}, booktitle={Proceedings of the IEEE International Conference on Computer Vision}, pages={86688678}, year={2019} }

附加资源: 项目网站 论文

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 17.02 MiB
最后更新 2025年4月22日
创建于 2025年4月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。