奥本海默电影Reddit讨论数据集

奥本海默电影Reddit讨论数据集 数据来源:互联网公开数据 标签:奥本海默电影,克里斯托弗诺兰,Reddit讨论,文本分析,情感分析,评论数据,电影评价 数据概述: 本数据集包含了关于2023年克里斯托弗·诺兰执导的电影《奥本海默》的60,000条评论和400个Reddit帖子。这些数据来源于Reddit上的五个子版块,分别是r/OppenheimerMovie、r/ChristopherNolan、r/CillianMurphy、r/movies和r/IMAX。数据集分为两个不同的CSV文件:一个包含Reddit帖子的信息,另一个包含帖子的评论内容。 帖子文件包括以下字段: - title: 帖子标题 - score: 帖子得分 - id: 帖子ID - url: 帖子的URL链接 - comms_num: 帖子收到的评论数量 - created: 帖子创建的时间戳 - subreddit: 帖子所在子版块的名称 - body: 帖子的全文内容 评论文件包括以下字段: - post_id: 评论所属的帖子ID - comment_id: 评论的ID - comment_parent_id: 评论回复的父评论ID - comment_body: 评论内容 - subreddit: 评论所在的社区/子版块名称 数据用途概述: 该数据集适用于文本分析、情感分析、文本可视化、问答系统、文本摘要、命名实体识别(NER)等多种任务。研究人员可以通过数据集对电影的公众反响进行深入分析,了解观众的观点和情绪倾向。评论数据也可以用于训练自然语言处理模型,实现评论的自动分类和观点提取。此外,数据集还可以用于市场调研,帮助企业更好地理解目标受众对电影的看法和偏好。请注意,该数据集尚未进行清洗和预处理,需要用户自行进行数据清理和处理。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 4.51 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。