数据集

YouTube视频音频片段分析数据集YouTubeVideoAudioChunkAnalysis-tawsiftashwardipto

数据来源：互联网公开数据

标签：音频分析, 语音识别, 视频内容分析, 多媒体数据, 视频片段, YouTube, 情感分析, 数据挖掘

数据概述：该数据集包含从YouTube视频中提取的音频片段，并附带了相应的元数据信息，用于多模态内容分析。主要特征如下：时间跨度：数据未明确标明具体时间，但从发布时间（publishedAt）字段推测，数据可能来自2024年6月。地理范围：数据主要来源于YouTube平台，其视频内容可能涵盖全球范围。数据维度：数据集包含两类核心数据：音频文件：mp3格式的音频片段，共1470个。结构化数据：CSV文件，记录了每个音频片段的详细信息，包括：chunk_filename（音频文件名），root_audio（原始视频ID），chunk_start(s)（片段起始时间），chunk_end(s)（片段结束时间），chunk_duration(s)（片段时长），vad_boundary（语音活动检测边界），subdirectory（子目录编号），video_id（视频ID），channelTitle（频道标题），title（视频标题），description（视频描述），tags（视频标签），publishedAt（发布时间），viewCount（观看次数），likeCount（点赞数），commentCount（评论数），duration（视频总时长），definition（视频清晰度），caption（字幕信息），channelId（频道ID），durationSecs（片段时长，秒），SaveDirName（保存目录名称），durationSecsTotal（视频总时长，秒），chunkNumber（片段编号），domain（数据来源域）。数据格式：主要包括CSV和MP3格式，CSV文件用于存储元数据，MP3文件为音频片段。数据已从YouTube视频中提取并进行了分块处理。该数据集适合用于音频分析、语音识别、情感分析、内容理解等领域的研究。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于音频信号处理、自然语言处理与视频内容分析的交叉研究，如语音识别模型训练、情感分析模型构建、视频内容摘要生成等。行业应用：可以为内容推荐系统、视频监控系统、智能客服等行业提供数据支持，尤其是在自动化内容分析、视频检索、广告投放等方面。决策支持：支持企业进行市场调研、用户行为分析，帮助优化内容创作策略、提升用户参与度。教育和培训：作为音频处理、机器学习、数据挖掘等课程的实训材料，帮助学生和研究人员深入理解多媒体数据分析。此数据集特别适合用于探索音频片段与视频内容之间的关联，分析用户对视频内容的反应，以及构建多模态内容理解模型，帮助用户实现精准内容推荐、提升用户体验等目标。

数据与资源

versions_20250310214806.zipZIP
102.20 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	102.2 MiB
最后更新	2025年5月19日
创建于	2025年5月19日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

YouTube视频音频片段分析数据集YouTubeVideoAudioChunkAnalysis-tawsiftashwardipto

数据与资源

附加信息

注册成功！