Reddit问答社区用户提问数据集-AskReddit等-2023

Reddit问答社区用户提问数据集-AskReddit等-2023 数据来源:互联网公开数据 标签:Reddit,问答社区,用户提问,NLP,社会研究,数据分析,用户行为

数据概述: 本数据集包含来自4个不同Reddit子版块(AskReddit、AskRedditAfterDark、AskMen、TooAfraidToAsk)的用户提问数据。数据集涵盖了近2万个问题条目,每个条目包含以下字段: - Display Name:提问用户的显示名称 - Created_utc:问题创建时间的Unix时间戳 - ID:每个问题的唯一标识符 - Title:问题的具体内容 - Score:问题获得的评分,表示其受欢迎程度或相关性 - Num_comment:每个问题收到的评论数量 - Over18:内容是否适合18岁以上用户,二元表示

数据来源广泛且多样,为自然语言处理(NLP)和其他社会科学研究提供了丰富的素材。

数据用途概述: 该数据集适用于自然语言处理任务、用户行为分析、社交媒体研究、社会趋势分析等多种场景。研究人员可以利用此数据进行文本挖掘、情感分析、主题建模等;教育机构可以使用数据进行数据分析课程的教学;市场研究者可以借此了解用户需求和偏好;企业可以利用数据分析结果优化产品和服务。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.19 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。