Reddit叙事中的道德判断数据集

数据集概述

该数据集聚焦Reddit平台叙事内容中的道德判断研究,通过社交常识与语言信号识别道德触发点。包含标注道德触发点的帖子实例数据,以及研究使用的事件聚类、语言特征参数等补充文档,为分析在线社区道德判断机制提供支持。

文件详解

  • post_instances.jsonl:JSON Lines格式文件,包含从Reddit帖子提取的实例,标注含道德触发点的实例为“1”,其他为“0”或不同标签。字段包括帖子ID、评论ID、上下文及通过正则表达式匹配的道德判断标签(如YTA、NTA等)。
  • sup_documents.pdf:PDF格式文件,包含论文中使用的c-event聚类完整列表及语言特征参数。

适用场景

  • 自然语言处理研究:用于训练和评估基于语言信号识别道德触发点的模型。
  • 在线社区行为分析:探究Reddit等平台用户道德判断的模式与机制。
  • 计算社会科学研究:分析社交常识与语言特征对道德判断的影响。
  • 道德心理学研究:通过在线文本数据研究群体道德认知与表达。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 64.13 MiB
最后更新 2025年12月13日
创建于 2025年12月13日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。