人类记忆与认知数据集
数据来源:互联网公开数据
标签:人类认知, 记忆, 叙事生成, 语言处理, 机器学习, 故事分类, 数据科学
数据概述:
本数据集收录了关于人类记忆与认知过程的数据,具体聚焦于个人经历与想象的故事生成。数据集包含近2500个故事样本,每个故事由参与者撰写,记录了其对现实事件的记忆或对虚构事件的想象。通过这些数据,研究者可以探索和分析人类在叙事生成过程中涉及的认知机制,比较想象与回忆之间的差异。
数据用途概述:
该数据集适用于认知心理学研究、机器学习模型开发、叙事分析等多种应用场景。研究者可以利用此数据集构建和验证认知模型,分析不同记忆类型(回忆、想象、重复叙述)之间的特征差异。此外,该数据集亦可用于自然语言处理任务,如故事分类、情感分析等。教育机构和培训机构也可以利用该数据集作为案例研究,帮助学习者理解人类记忆与认知的复杂性。
举例:
AssignmentId: 故事的唯一标识符,例如 "81527394"
WorkTimeInSeconds: 完成任务所需的时间,例如 "345" 秒
WorkerId: 工作者的唯一标识符,例如 "A123456789"
annotatorAge: 工作者的年龄范围,例如 "25-29"
annotatorGender: 工作者的性别,例如 "female"
annotatorRace: 工作者的种族/民族,例如 "Asian"
distracted: 编写故事时的分心程度,使用5点李克特量表评分,例如 "2"
draining: 编写故事时的情绪消耗程度,使用5点李克特量表评分,例如 "3"
frequency: 思考或谈论该事件的频率,使用5点李克特量表评分,例如 "4"
importance: 故事/事件对参与者的重要性评分,使用5点李克特量表评分,例如 "5"
logTimeSinceEvent: 记忆事件与当前时间的对数天数,例如 "5.2"
mainEvent: 故事的主要事件概述,例如 "毕业典礼"
memType: 故事类型(回忆、想象、重复叙述),例如 "recalled"
mostSurprising: 故事中最令人惊讶的方面,例如 "典礼上我突然忘词了"
openness: 工作者的开放性评分,范围从1到10,例如 "8.5"
recAgnPairId: 对应的回忆故事的ID(仅限重复叙述的故事),例如 "12345"
recImgPairId: 对应的回忆故事的ID(仅限想象的故事),例如 "12345"
similarity: 该事件/故事与参与者生活的相似性评分,使用5点李克特量表评分,例如 "3"
similarityReason: 相似性的详细说明,例如 "我也是在大学里参加过毕业典礼"
story: 参与者撰写的完整故事,包含15到25个句子
stressful: 编写任务的压力程度评分,使用5点李克特量表评分,例如 "2"
summary: 故事的简要摘要,包含1到3个句子,例如 "我在大学的毕业典礼上突然忘词了,但最终还是完成了演讲"
timeSinceEvent: 记忆事件与当前时间的天数,例如 "150"