数据集

自动化计算场景构图算法的短视频制作数据集

数据集概述

本数据集围绕自动化计算场景构图算法的短视频制作流程构建，涵盖文本预处理、实体识别、媒体检索、时间线分析及文本媒体整合等核心环节，包含输入文本、处理结果及实体上下文等相关数据文件，为短视频自动化生成研究提供支持。

文件详解

该数据集包含多个目录和文件，具体说明如下： - 输入目录文件 (位于 Short Video Production with Automated Computation/Data/Input_Directory/ 目录下): - loveletters_300.csv: CSV格式，包含300封情书的ID、标题和内容字段 - Randomly_selected_10_loveletters.xlsx: Excel格式，随机选取的10封情书数据 - 句子分割目录文件 (位于 Short Video Production with Automated Computation/Data/Sentence_Segmentation/ 目录下): - loveletter_ssegmented.csv: CSV格式，情书文本的句子分割结果数据 - preprocessed_cleaned_segments (1).csv: CSV格式，预处理后的清洁文本片段数据 - 实体上下文目录文件 (位于 Short Video Production with Automated Computation/Data/Entities _with_context/ 目录下): - Results _sentiment _ pragmatic.csv: CSV格式，包含序号、标题、内容、文本片段、情感极性（TextBlob、VADER、Flair）、情绪预测、地点、人物及氛围词等字段

适用场景

短视频自动化生成研究：分析文本到视频转换的算法流程与效果
自然语言处理应用：探究文本分割、实体识别及情感分析在视频制作中的作用
多媒体整合技术研究：研究文本与媒体资源的自动化匹配与时间线构建方法
情感计算分析：利用情感极性数据研究文本情感向视频元素的转化规律

数据与资源

gdvtwhm5rs-2.zipZIP
0.18 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	0.18 MiB
最后更新	2025年11月28日
创建于	2025年11月28日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。