Reddit平台板球讨论内容数据集-r-Cricket-2024年-gpreda

Reddit平台板球讨论内容数据集-r-Cricket-2024年-gpreda 数据来源:互联网公开数据 标签:板球,Reddit,社交媒体,讨论,评论,帖子,体育,文本分析,情感分析,话题

数据概述: 本数据集收录了Reddit社交平台r/Cricket子版块(r/Cricket)中关于板球讨论的帖子和评论内容,数据未经过滤。r/Cricket是Reddit上一个供用户讨论板球相关话题的社区,用户可以在此分享观点、进行辩论。数据集通过使用Python Reddit API Wrapper (praw)抓取r/Cricket子版块的帖子和评论数据,数据来源为 https://www.reddit.com/r/Cricket

数据包含帖子和评论两种类型,每条数据都包含以下字段:

  • title:帖子标题(仅对帖子有效)
  • score:帖子评分,反映帖子的受欢迎程度,基于点赞数和评论数(仅对帖子有效)
  • id:帖子的唯一ID
  • url:帖子链接(仅对帖子有效)
  • commns_num:帖子的评论数量(仅对帖子有效)
  • created:创建日期
  • body:帖子或评论的文本内容
  • timestamp:时间戳

数据覆盖时间为2024年。

数据用途概述: 该数据集可用于多种研究和应用场景,包括:

  • 情感分析:分析用户对不同板球赛事、球队、球员的观点和情绪。
  • 话题识别:识别r/Cricket社区中讨论的热门话题和趋势。
  • 文本分析:进行文本挖掘,了解用户对板球比赛的讨论内容。
  • 舆情监测:追踪公众对板球相关事件的看法。
  • 社交媒体分析:研究Reddit用户在板球话题上的互动模式和行为。
  • 数据科学实践:为数据科学项目提供数据源,例如构建文本分类模型、情感分析模型等。
packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 4.71 MiB
最后更新 2025年4月22日
创建于 2025年4月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。