皮质动力学中语法类别涌现的计算理论数据集

数据集概述

本数据集围绕“皮质动力学中语法类别涌现的计算理论”研究构建,包含训练模型的语料库、语法解析输出、语法标签、词类别信息及模型测试结果等文件,为探索语法类别在皮质动力学中的涌现机制提供数据支持。

文件详解

  • 语料库与解析文件:
  • Corpora.txt(.txt格式):训练模型的语料库,源自wiki-split的test.tsv,已去除标点和特殊字符,每行一句
  • Enju_Output.txt(.txt格式):Enju工具以-so模式解析Corpora.txt的输出,包含HPSG语法的英文句子解析结果
  • 标签与类别文件:
  • Supervision.txt(.txt格式):语料库的语法标签,每行一个词标签,句子间用空行分隔
  • Word_Category.txt(.txt格式):词的粗粒度类别标签,每行一个词类别,句子间用空行分隔
  • 测试与分析文件:
  • SynSemTests.xlsx(.xlsx格式):语法分类结果及统计分析数据
  • ModelsComparison.xlsx(.xlsx格式):模型比较相关数据
  • IndividualTaggingPerformance.xlsx(.xlsx格式):个体标注性能数据
  • 文档与说明文件:
  • README(无格式):数据集说明文档
  • Data_Availability_Statement(无格式):数据可用性声明
  • Frontiers_Supplementary_Material.pdf(.pdf格式):补充材料文档

适用场景

  • 计算语言学研究:分析语法类别涌现的计算机制
  • 自然语言处理模型训练:用于语法解析、词类别标注等模型的训练与测试
  • 皮质动力学与语言认知交叉研究:探索语法类别在皮质动力学中的表征模式
  • 语法理论验证:验证语法类别涌现相关理论的实证数据支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 107.56 MiB
最后更新 2025年12月17日
创建于 2025年12月17日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。