数据集概述
本数据集是基于Robert Cloninger理论构建的人类思维平面测量数据集。研究团队首先使用Cloninger理论对字典中最常用的1万个单词进行标注,确定每个单词的主导思维平面,并以这些单词作为基准对句子进行标注。数据集包含从Collins Dictionary和YourDictionary网站收集的2万个句子,每个句子都按照思维平面理论进行标注。这是该领域首个以这种方式测量人类思维平面的数据收集工作。
文件详解
- 句子数据文件
- 文件名称:
sentences.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含ID(标识符)、plane(思维平面)、Sentences(句子文本)三列数据
- 单词标注文件
- 文件名称:
words.xlsx、words-eXfitD.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含1万个最常用波斯语单词及其各种含义的思维平面标注
- 数据说明文件
- 文件名称:
README.txt
- 文件格式:TXT
- 字段映射介绍:提供数据集的使用说明、标注方法和注意事项
- 可视化图表
- 文件名称:
labelling.png、example.png、Data distribution.png
- 文件格式:PNG
- 字段映射介绍:展示标注示例、数据分布统计等可视化信息
数据来源
Collins Dictionary和YourDictionary网站
适用场景
- 心理语言学分析: 研究语言表达与思维平面之间的关系,探索词汇和句子层面的心理特征
- 自然语言处理研究: 为情感分析、文本分类等NLP任务提供基于心理学理论的标注数据
- 认知科学研究: 分析不同思维平面在语言表达中的分布规律和特征模式
- 跨文化心理学研究: 基于波斯语文本数据,研究特定文化背景下的思维表达特点
- 教育心理学应用: 为语言教学和思维训练提供理论依据和数据支持