Reddit平台苹果公司AAPL股票讨论文本数据集-2005-2010
数据来源:互联网公开数据
标签:苹果,AAPL,Reddit,社交媒体,股票,情感分析,舆情分析,文本数据,时间序列,投资
数据概述:
本数据集收录了2005年至2010年期间,Reddit平台上关于苹果公司(AAPL)股票讨论的文本数据。数据来源于SocialGrep,包含了帖子和评论,并标注了其评分。该数据集旨在探索公众舆论对苹果公司股票估值的影响。数据集包含两个文件:一个文件包含评论数据,另一个文件包含帖子数据。
评论数据文件(five-years-of-aapl-on-reddit-comments.csv)的字段包括:
* type:帖子或评论的类型(字符串)
* subreddit.name:帖子或评论所在的子版块名称(字符串)
* subreddit.nsfw:子版块是否为NSFW(布尔值)
* created_utc:帖子或评论的创建时间戳(整数)
* permalink:帖子或评论的永久链接(字符串)
* body:帖子或评论的正文文本(字符串)
* sentiment:帖子或评论的情感倾向(字符串)
* score:帖子或评论的评分(整数)
帖子数据文件(five-years-of-aapl-on-reddit-posts.csv)的字段包括:
* type:帖子或评论的类型(字符串)
* subreddit.name:帖子或评论所在的子版块名称(字符串)
* subreddit.nsfw:子版块是否为NSFW(布尔值)
* created_utc:帖子或评论的创建时间戳(整数)
* permalink:帖子或评论的永久链接(字符串)
* score:帖子或评论的评分(整数)
* domain:帖子或评论的域名(字符串)
* url:帖子或评论的URL(字符串)
* selftext:帖子的正文文本(字符串)
* title:帖子的标题(字符串)
数据用途概述:
该数据集可用于研究公众对苹果公司股票的情绪和看法,以及这些情绪与股票价格之间的潜在关系。研究人员可以使用该数据进行情感分析,分析不同子版块中关于AAPL的讨论,并探索公众情绪与股票表现之间的关联。该数据集也适用于时间序列分析,研究公众情绪随时间的变化趋势。此外,该数据可用于构建预测模型,预测苹果公司股票的未来表现。