数据集概述
本数据集为Cortex提交的统计分析原始数据,包含33个文件,涉及实验设计、数据处理、结果分析等内容,覆盖模型、相关性、预测等统计维度,以及控制实验、原始数据处理、CT医学影像、图片视觉、文本词汇等多领域关键词,可支持多维度统计分析研究。
文件详解
- 统计分析文件(.spwb格式,15个)
- 示例文件:ageacquisition analysis.spwb、ageacquisitionstimuliresponses data.sav(注:此处.sav为数据文件,.spwb为分析文件)、4 utterances number analysis.spwb等
- 内容:包含统计模型构建、相关性分析、预测分析等实验相关的分析文件
- 数据文件(.sav格式,10个)
- 示例文件:Ageandsex data.sav、masterfile data june 25 2023.sav、Agreement data.sav等
- 内容:存储实验原始数据,如年龄性别数据、主文件数据、一致性数据等
- 表格与结果文件(.xlsx格式,4个)
- 示例文件:By-picture analysis.xlsx、Rating Scale - English.xlsx、Time duration data from drawing tasks (1).xlsx等
- 内容:包含图片分析结果、评分量表数据、绘图任务时长数据等
- 文档文件(.doc格式,3个)
- 示例文件:Table 1 variable data.doc、semantic content results.doc、analisi by items.doc
- 内容:包含变量数据表、语义内容结果、项目分析文档等
- CSV文件(.csv格式,1个)
- 文件名称:word2vec results.csv
- 字段映射:包含group(组)、subject(受试者)、stimuli(刺激物)、ground_truth(真实值)、prediction1(预测值1)、prediction2(预测值2)、manual_similarity_score1(手动相似度评分1)、manual_similarity_score2(手动相似度评分2)、tokenized_ground_truth(分词真实值)、tokenized_prediction1(分词预测值1)、tokenized_prediction2(分词预测值2)、distance_predication1(预测距离1)等字段
适用场景
- 统计模型验证: 利用.spwb文件中的模型数据,验证统计模型的相关性、预测准确性等性能
- 实验数据挖掘: 分析.sav格式的原始数据,挖掘年龄、性别等变量与实验结果的关联
- 文本语义分析: 基于word2vec results.csv中的分词、相似度评分等字段,研究文本语义相关性
- 实验设计优化: 参考评分量表、绘图时长等数据,优化实验刺激设计与任务流程
- 多模态数据整合: 结合图片分析、文本数据与统计模型结果,开展多模态实验研究