TED演讲视频数据分析-YouTube演讲视频数据集-2024年3月16日
数据来源:互联网公开数据
标签:TED,演讲,视频,YouTube,教育,科技,娱乐,设计,演讲视频,数据分析
数据概述:
本数据集来源于YouTube频道“TED”,数据抓取时间为2024年3月16日。数据通过API获取TED频道的ID,并使用Node.js代码进行抓取。数据集包含TED频道发布的演讲视频信息,涵盖科技、娱乐、设计、科学、商业、全球议题、艺术等多个领域。
原始数据中,删除了以下字段:“channelId”、“publishedAt”、“position”、“duration”、“dimension”、“definition”、“defaultLanguage”、“thumbnail_maxres”、“licensedContent”、“locationDescription”、“latitude”、“longitude”、“dislikeCount”、“favoriteCount”。
对“publishedAtSQL”字段进行了拆分,分为“release_date”(发布日期)和“release_time”(发布时间)两个字段。
将“durationSec”(视频时长,单位:秒)字段转换为“duration”(视频时长,格式:mm:ss)。
对“Title”(标题)字段进行了拆分,分为“Title”(演讲标题)和“Speaker”(演讲者)两个字段。
数据用途概述:
该数据集适用于TED演讲视频的分析研究,包括演讲主题、演讲者、发布时间、观看量、评论量等。可用于分析演讲内容趋势、演讲者受欢迎程度、观众互动情况等。此外,该数据集也可用于教育、市场调研、内容创作等多种场景。例如,可以用于分析不同主题演讲的受欢迎程度,了解观众偏好;也可以用于构建推荐系统,为用户推荐感兴趣的演讲视频。