数据集概述
本数据集围绕系统发育表型矩阵评分任务,对比分析了非专家群体与领域专家的表现差异。核心内容包括不同生物类群(如蝙蝠、海葵、百合等)的表型特征评分结果、群体评分准确性数据,以及用于预测任务难度的模型数据,为探索群体协作在系统发育研究中的应用价值提供支撑。
文件详解
该数据集包含22个文件,按类型分为:
- 物种特征评分结果文件(.xlsx格式):
- 如Appendix 5 Bats-character-taxon-results.xlsx、Appendix 3 Anemones-character-taxon-results.xlsx等13个文件,分别对应蝙蝠、海葵、百合等生物类群的特征-分类单元评分结果。
- 群体用户评分结果文件(.csv格式):
- 如Appendix 4 Anemones-user-results.csv、Appendix 6 Bats-users-results.csv等6个文件,记录群体用户的评分数据,包含Estimate(估计值)、p.value(P值)、ci.lower/ci.upper(置信区间)、n.scores(评分数量)、n.correct(正确数量)等字段。
- 数据与脚本压缩包(.zip格式):
- Appendix 19 Data and R Scripts.zip、Appendix 19 Data and R Scripts_MAH modified.zip,包含用于分析的原始数据及R语言脚本。
- 群体指导文件(.pdf格式):
- Appendix 20 Instructions to Crowd.pdf,为群体参与者提供的任务指导说明。
适用场景
- 系统发育研究:分析群体协作在表型特征编码任务中的准确性,优化系统发育树构建的数据收集流程。
- 群体智慧研究:探索非专家群体在复杂科学任务中的表现规律,验证群体共识与专家判断的差异。
- 任务难度预测:基于特征难度预测模型,研究如何高效分配专家与群体的工作任务。
- 生物多样性数据处理:为大规模物种表型数据的自动化收集与验证提供方法参考。