数据集概述
本数据集为欧洲MeMAD项目的一部分,包含萨里大学创建的人工内容描述(CD)语料和阿尔托大学生成的机器描述(MD)语料,针对45部电影的500个视频片段构建。数据集通过电影ID和6位代码对齐两种描述,支持分析人类与机器生成视频描述的差异,用于多模态内容管理技术研发。
文件详解
readme file and distribution licence-Surrey dataset.txt
- 文件格式:TXT
- 字段映射介绍:包含数据集背景、创建目的、使用许可等说明文档内容。
MeMAD500 CLIPS 6-digit codes_Surrey.csv
- 文件格式:CSV
- 字段映射介绍:包含电影编号、电影标题、片段总数、分三段的片段数量及范围等信息,用于对齐CD和MD语料。
MeMAD500_CD_Surrey.xml
- 文件格式:XML
- 字段映射介绍:萨里大学人工创建的视频场景描述语料,采用TEI标签编码,包含片段ID、时间码、词性标注等元数据。
MeMAD500_MD_Surrey.xml
- 文件格式:XML
- 字段映射介绍:阿尔托大学机器生成的视频描述语料,结构与CD语料一致,用于与人工描述对比。
数据来源
欧洲MeMAD项目(Methods for Managing Audiovisual Data: Combining Automatic Efficiency with Human Accuracy,项目编号780069)
适用场景
- 多模态内容描述技术评估:对比人类与机器生成视频描述的差异,优化机器描述模型。
- 视听数据管理研发:支持开发多语言、多场景的数字视听信息管理与访问技术。
- 计算机视觉与机器学习应用:结合人类处理多模态内容的洞察,改进视频理解算法。
- 自然语言处理研究:分析视频场景描述的语言特征,提升机器生成文本的自然度与准确性。