数据集概述
本数据集为AGREE基准,用于评估古希腊语义模型,包含两项专家任务的原始数据、最终基准数据集及问卷原始答案。数据基于专家对古希腊词汇语义相关性的判断构建,支持语义模型性能验证,总计包含5个文件。
文件详解
1_agree_task1.json(JSON格式)
- 字段:pair(古希腊词汇对)、frequency(专家建议次数)、POS1/POS2(词汇词性)、benchmark(是否纳入基准)
2_agree_task2.json(JSON格式)
- 字段:pair(古希腊词汇对)、origin(数据来源类型)、respondents(评估专家数)、score(平均相关度得分)、agreement(标注一致性)、benchmark(是否纳入基准)
3_agree_final_benchmark.json(JSON格式)
- 字段:pair(古希腊词汇对)、origin(数据来源任务)
answers_Task1_postprocessed.xlsx(XLSX格式)
- 内容:第一项问卷的后处理答案
raw_answers_Task2.xlsx(XLSX格式)
- 内容:第二项问卷的原始答案
数据来源
论文“AGREE: a new benchmark for the evaluation of distributional semantic models of ancient Greek”
适用场景
- 古希腊语义模型评估: 用于验证分布语义模型对古希腊词汇相关性的预测能力
- 语义标注一致性研究: 分析专家对古希腊词汇语义相关度判断的一致性
- 历史语言学数据构建: 为古希腊语言语义研究提供结构化评估基准
- 自然语言处理基准开发: 支持针对古典语言的语义模型基准测试框架设计