数据集概述
本数据集包含从Weverse平台BTS频道获取的用户信息及文本数据(帖子和评论)。2024年3月3日首次爬取获得16020条帖子和14223个用户ID,5月24日回访获取3410个活跃用户在3-5月的167456条帖子和484437条评论,包含时间戳、文本、昵称及URL等信息,经英文过滤和LIWC-22分析形成两个数据集文件。
文件详解
- Weverse_BTS_User_Dataset.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含活跃用户的基本信息,以及用户在2024年3月3日至5月3日期间发布的所有帖子和评论数据,每条记录涵盖时间戳、文本内容、用户昵称、用户个人主页URL等字段。
- Weverse_BTS_LIWC_Dataset.xlsx
- 文件格式:XLSX
- 字段映射介绍:基于英文文本过滤后的帖子和评论数据,通过LIWC-22工具分析得到的文本特征数据集,包含原始文本对应的语言学分析指标(如情绪、认知过程等维度的量化结果)。
数据来源
Weverse平台BTS频道(https://weverse.io/bts/feed)
适用场景
- 粉丝社区行为分析: 研究BTS粉丝在Weverse平台的发帖频率、互动模式及活跃用户特征。
- 文本内容情感研究: 利用LIWC分析结果探究粉丝评论和帖子中的情绪倾向、情感表达规律。
- 社交媒体用户画像构建: 通过用户发布内容及互动数据构建BTS粉丝的用户画像,分析群体特征。
- 跨文化传播研究: 针对英文文本数据,分析BTS在英语用户群体中的传播影响力及内容偏好。