数据集概述
该数据集包含TikTok视频及评论数据分析结果,按小时和日两个时间维度分类,覆盖互动指标、创作时间、地域分布等基础数据,以及主题、儿童相关内容、评论的专项分析,为TikTok内容生态研究提供结构化数据支持。
文件详解
数据集按时间维度和分析主题分为多层目录结构,核心文件说明如下:
- 小时维度数据(tiktok-hour/hour/目录):
- 基础互动指标文件:share_count.csv(分享量分布)、digg_count.csv(点赞量分布)、comment_count.csv(评论量分布)、play_count.csv(播放量分布),均为CSV格式
- 时间与地域数据:create_time_count.csv(创作时间分布)、id_timestamp_count.csv(含错误视频的创作时间分布)、location_created_count.csv(创作地域分布)、createtime_location_created.csv(创作时间与地域联合分布),均为CSV格式
- 主题分析文件(topics/目录):topic_desc.parquet(主题描述及视频数量);各[topic_id]子目录下含play_count_dist.csv(主题内播放量分布)、location_created_dist.csv(主题内创作地域分布),均为CSV格式
- 国家专项文件([country_name]/目录):[engagement_type]_count.csv(国家层面互动指标分布),CSV格式
- 日维度数据(tiktok-hour/day/目录):
- 基础互动指标文件:share_count.csv、digg_count.csv、comment_count.csv、play_count.csv,内容与小时维度一致,为24小时数据,CSV格式
- 时间与地域数据:create_time_count.csv、id_timestamp_count.csv、location_created_count.csv、createtime_location_created.csv,为24小时数据,CSV格式
- 儿童相关文件(children/目录):play_count_dist.csv(含儿童视频播放量分布)、country_share_videos_with_children.csv(各国含儿童视频占比);各[country_name]子目录下play_count_dist.csv(特定国家含儿童视频播放量分布),均为CSV格式
- 评论分析文件(comments/目录):comment_language_counts.csv(评论语言分布)、create_time_dist.csv(评论创作时间分布),CSV格式
- 国家专项文件([country_name]/目录):[engagement_type]_count.csv(国家层面互动指标分布),CSV格式
适用场景
- 短视频平台生态研究:分析TikTok视频互动特征、创作时间规律及地域分布差异
- 内容安全分析:研究含儿童内容的视频传播情况及地域分布
- 主题内容研究:探索不同主题视频的播放量及地域分布特征
- 评论数据挖掘:分析评论语言分布及时效性规律
- 国家市场分析:对比不同国家TikTok视频的互动指标差异