数据集概述
本数据集包含MR Lit相关的推文原始数据,涵盖推文时间、内容、曝光量、转发量等信息。包含独立文件压缩包及合并文件,保留推文ID、链接、文本、时间、互动指标等核心字段,共61个文件,支持社交媒体数据的统计与分析。
文件详解
- 独立CSV文件
- 文件名称:遵循
tweet_activity_metrics_Mendelian_lit_YYYYMMDD_YYYYMMDD_en.csv模式(例如:tweet_activity_metrics_Mendelian_lit_20190301_20190401_en.csv)
- 文件格式:CSV
- 字段映射介绍:包含Tweet id(推文ID)、Tweet permalink(推文链接)、Tweet text(推文内容)、time(时间)、impressions(曝光量)、engagements(互动量)、engagement rate(互动率)、retweets(转发量)、replies(回复量)、likes(点赞量)、user profile clicks(用户主页点击量)、url clicks(链接点击量)等字段
- 压缩包文件
- 文件名称:
mr_lit_tweets.zip
- 文件格式:ZIP
- 内容说明:包含所有独立CSV文件的压缩包
- 合并文件
- 文件名称:未明确具体名称(描述中提及“combined file added which is all the separate csvs together”)
- 文件格式:推测为CSV
- 字段映射介绍:整合所有独立CSV文件的字段,保留Tweet id、Tweet permalink、Tweet text、time、impressions、engagements、engagement rate、retweets、replies、likes、user profile clicks、url clicks等核心字段,并新增date列
- R代码文件
- 文件名称:
mrlit_tweets.R
- 文件格式:R
- 内容说明:与MR Lit推文数据相关的R代码文件
数据来源
MR Lit
适用场景
- 社交媒体内容分析: 研究MR Lit相关推文的文本内容特征、主题分布及传播规律
- 推文互动行为研究: 分析曝光量、转发量、点赞量等互动指标与推文内容的关联
- 时间序列分析: 基于推文时间字段,探索MR Lit相关话题的时间分布及趋势变化
- 社交媒体营销效果评估: 利用互动率等指标评估MR Lit相关内容的传播效果
- 数据挖掘算法验证: 作为社交媒体数据样本,支持文本分类、情感分析等算法的训练与验证