找到4个数据集

标签: 语言标注

过滤结果
  • Ihanzu_ELAR_词汇诱导会话修改版音频处理教程数据

    2026年1月30日 30 164 68

    数据集概述 本数据集为Andrew Harvey开展的3次Ihanzu词汇诱导会话的修改版本,原始数据来自濒危语言档案库(ELAR)。数据已重采样为16 kHz单声道16位PCM格式,适用于音频处理教程,包含3个文件,可通过Zenodo获取。 文件详解 文件名称:ihanzu-harvey-0596_20180518opq.zip 文件格式:ZIP...
    packageimg
  • Wikidata_wdumps_Based_俄英名词语法性别RDF数据集_原始

    2026年1月19日 30 129 106

    数据集概述 本数据集是通过wdumps工具生成的Wikidata RDF转储,核心内容为包含语法性别的俄语、英语名词数据。数据集包含4个文件,涵盖JSON格式的配置与元数据文件、压缩的N-Triples数据文件及预览文件,可用于语义网络、自然语言处理等领域的相关研究。 文件详解 配置与元数据文件 文件名称:wdumper-spec.json...
    packageimg
  • AmadissigloXX_Based_现代骑士文学与堂吉诃德重写数据库_v1_1

    2026年1月14日 30 64 1

    数据集概述 本数据集是AmadissigloXX项目下的现代骑士文学与《堂吉诃德》重写数据库,包含Antonio Ledesma Hernández于1903年创作的《Canuto Espárrago》相关数据。数据集提供JSON格式的作品元数据与XML格式的完整数据库,支持对该作品的文学研究与文本分析。 文件详解 JSON文件:...
    packageimg
  • IN02013_Draft_Epidoc格式_Pasupati_Siva_linga梵语铭文XML数据

    2026年1月1日 30 190 74

    数据集概述 本数据集为IN02013 Pasupati Siva linga铭文的梵语XML文件,采用Epidoc格式草案版本,无元数据,计划纳入“Siddham”档案。数据集包含1个XML文件,记录该铭文的数字化文本内容,是梵语铭文文献研究的基础资料。 文件详解 文件名称:IN02013.xml 文件格式:XML...
    packageimg