数据集概述
本数据集围绕自动化计算场景构图算法的短视频制作流程构建,涵盖文本预处理、实体识别、媒体检索、时间线分析及文本媒体整合等核心环节,包含输入文本、处理结果及实体上下文等相关数据文件,为短视频自动化生成研究提供支持。
文件详解
该数据集包含多个目录和文件,具体说明如下:
- 输入目录文件 (位于 Short Video Production with Automated Computation/Data/Input_Directory/ 目录下):
- loveletters_300.csv: CSV格式,包含300封情书的ID、标题和内容字段
- Randomly_selected_10_loveletters.xlsx: Excel格式,随机选取的10封情书数据
- 句子分割目录文件 (位于 Short Video Production with Automated Computation/Data/Sentence_Segmentation/ 目录下):
- loveletter_ssegmented.csv: CSV格式,情书文本的句子分割结果数据
- preprocessed_cleaned_segments (1).csv: CSV格式,预处理后的清洁文本片段数据
- 实体上下文目录文件 (位于 Short Video Production with Automated Computation/Data/Entities _with_context/ 目录下):
- Results _sentiment _ pragmatic.csv: CSV格式,包含序号、标题、内容、文本片段、情感极性(TextBlob、VADER、Flair)、情绪预测、地点、人物及氛围词等字段
适用场景
- 短视频自动化生成研究:分析文本到视频转换的算法流程与效果
- 自然语言处理应用:探究文本分割、实体识别及情感分析在视频制作中的作用
- 多媒体整合技术研究:研究文本与媒体资源的自动化匹配与时间线构建方法
- 情感计算分析:利用情感极性数据研究文本情感向视频元素的转化规律