找到576个数据集

标签: 语料库建设

过滤结果
  • Carvalho_Kury_Based_Gyndoides属形态特征列表数据_待发表

    2026年1月18日   

    数据集概述 本数据集是Carvalho & Kury待发表论文中关于Gyndoides属(Opiliones目,Gonyleptidae科)修订研究的形态特征列表。包含优化后的形态特征条目,用于支持该属的分类学修订工作,数据集仅含一个文档文件。 文件详解 文件名称:Table 1 - List of Ccts (after...
    packageimg
  • musiXplora_Based_Franz_Weinl_w3215_音乐家档案数据

    2026年1月18日   

    数据集概述 本数据集为音乐家Franz Weinl(musiXplora-ID:w3215)的个人档案数据,包含其基础信息、职业经历、活动领域、作品集及合作方等内容,覆盖1914至1946年的相关记录,为研究该音乐家的职业生涯提供结构化参考。 文件详解 文件名称:w3215_DE.json 文件格式:JSON...
    packageimg
  • Objaverse_Sketchfab_Source_陶瓷卫浴部件3D模型及预览数据

    2026年1月18日   

    数据集概述 本数据集包含陶瓷卫浴部件1的3D模型文件及配套预览图片,共6个文件。数据源自Objaverse 1.0和Sketchfab平台,可用于陶瓷卫浴部件的3D展示、设计参考等场景,文件类型以JPEG预览图为主,包含一个GLB格式的3D模型文件。 文件详解 3D模型文件...
    packageimg
  • Objaverse_1_0_Sketchfab_Roman_Helmet模型文件数据

    2026年1月18日   

    数据集概述 本数据集包含Roman Helmet(罗马头盔)的3D模型相关文件,是首次使用ZBrush工具制作的模型数据。数据集共含6个文件,主要包括模型预览图片和3D模型文件,可用于3D模型展示、建模学习参考等场景。 文件详解 模型预览图片文件...
    packageimg
  • musiXplora_Based_Eberhard_Bonitz_音乐家生平档案数据

    2026年1月18日   

    数据集概述 本数据集为音乐家Eberhard Bonitz的生平档案数据,包含其基本身份信息、生卒信息、职业领域、活动地点及相关来源等内容,通过结构化JSON文件记录,是研究该音乐家职业生涯与社会活动的基础资料。 文件详解 文件名称:b2171_DE.json 文件格式:JSON...
    packageimg
  • Alpha_Bantu_Tone_2_班图语声调研究主要描述性来源文献目录数据_V2

    2026年1月18日   

    数据集概述 本数据集为班图语声调研究的文献目录数据,是数据库Alpha版本的第二版,收录了班图语声调研究的主要描述性来源文献信息,为语言学研究提供结构化的文献参考资料,包含1个压缩文件。 文件详解 文件名称:AlphaBantuDatabase-2.zip 文件格式:ZIP...
    packageimg
  • La_Pola_Siero_Based_阿斯图里亚斯地图_问题3_拉波拉西罗语料数据

    2026年1月18日   

    数据集概述 本数据集属于拉波拉西罗语料库,核心内容为与阿斯图里亚斯地图相关的问题3文档数据。数据集仅包含1个文件,无目录层级划分,未进行训练/测试、数据/标签或原始/处理数据的拆分,为单一的文档类数据资源。 文件详解 文件名称:Mapa de Asturias.Pregunta3.docx 文件格式:DOCX...
    packageimg
  • HCD_Historical_Corpus_of_Dutch_词频统计数据_2023

    2026年1月18日   

    数据集概述 本数据集为荷兰历史语料库(HCD)的词频统计数据,涵盖不同地区、世纪和体裁的词频分布情况。HCD是一个包含早期和晚期现代荷兰语的多体裁语料库,数据来源于2023年发表的相关学术论文,可用于荷兰历史语言学和文本分析研究。 文件详解 文件名称:wordcount_overview.xlsx 文件格式:XLSX...
    packageimg
  • French_WSD_Based_Princeton_WordNet标识符法语词义消歧数据集

    2026年1月17日   

    数据集概述 本数据集用于基于Princeton WordNet标识符的法语词义消歧任务,包含两个自动翻译并对齐的训练语料库(SemCor、WordNet Gloss Corpus),以及一个从SemEval 2013任务12转换而来的测试语料库,总计3个XML文件。 文件详解 训练语料库文件...
    packageimg
  • musiXplora_Ludwig_Breitenberger_b1924_音乐人物档案数据

    2026年1月17日   

    数据集概述 本数据集为音乐人物Ludwig Breitenberger(musiXplora-ID: b1924)的结构化档案数据,包含其基本身份信息、生平时间节点、职业领域、活动地点及相关文献来源等核心内容,以JSON格式存储,是研究该音乐人物的基础参考资料。 文件详解 文件名称:b1924_DE.json 文件格式:JSON...
    packageimg
  • musiXplora_Source_Leopold_Gandl音乐人物档案数据_v0_0_1

    2026年1月17日   

    数据集概述 本数据集为音乐人物Leopold Gandl的结构化档案信息,包含其身份标识、生平时间地点、职业领域、活动地点等核心内容,通过JSON格式存储,是研究该音乐人物的基础参考数据。 文件详解 文件名称:g2389_DE.json 文件格式:JSON...
    packageimg
  • unparliamentary_Based_澳大利亚联邦议会非议会性词汇共现元语用学标注数据

    2026年1月17日   

    数据集概述 本数据集为电子表格,记录澳大利亚联邦议会会议记录中与"非议会性"(unparliamentary)词汇共现的词群元语用学标注信息。包含词群相似度排序、标注类别、相关演讲数量及时间趋势等结构化内容,用于分析议会话语中"非议会性"词汇的使用语境与元语用特征。 文件详解...
    packageimg
  • CreoPhonPt_Repository_葡萄牙克里奥尔语语音词汇数据集1_0

    2026年1月15日   

    数据集概述 本数据集为CreoPhonPt 1.0,是一个整合葡萄牙语基础克里奥尔语语音学和词汇相关数据的资源库,旨在让这些语言的数据更易获取和整理,以促进定量分析。该项目仍在开发中,包含一个压缩文件。 文件详解 文件名称:CreoPhonPt-creoles.zip 文件格式:ZIP...
    packageimg
  • musixplora_Giorgio_Stohas_s4556_音乐人物档案数据

    2026年1月15日   

    数据集概述 本数据集为Giorgio Stohas (s4556)的音乐人物档案数据,包含其基本信息、职业领域、活动地点、相关文献及事件等内容,源自musixplora平台,以JSON格式存储,可用于音乐人物研究与档案查询。 文件详解 文件名称:s4556_DE.json 文件格式:JSON...
    packageimg
  • Pterostichus_DNA_Based德国步甲属及近缘类群条形码库补充材料

    2026年1月15日   

    数据集概述 本数据集为德国步甲属(Pterostichus)及近缘类群DNA条形码库的补充材料,源自ZooKeys期刊2020年发表的研究论文,通过BOLD工作平台进行条形码分析,是昆虫分类学研究的重要参考数据。 文件详解 文件名称:oo_468263.docx 文件格式:DOCX...
    packageimg
  • Gentellet_g2222_musiXplora_巴黎木管乐器制造商信息数据

    2026年1月15日   

    数据集概述 本数据集记录了木管乐器制造商Gentellet(musiXplora-ID:g2222)的核心信息,包括其性别、活动时间(1814-1865)、所属行业、职业、主要活动地点巴黎,以及相关作品集、机构关联、出版物和事件等内容,为研究19世纪巴黎木管乐器制造行业提供参考。 文件详解 文件名称:g2222_DE.json 文件格式:JSON...
    packageimg
  • Paĩ_Tavyterã_语言田野调查_名词动词词干提取数据2017_01_02

    2026年1月15日   

    数据集概述 本数据集为巴拉圭Amambay地区Paĩ Tavyterã Guarani语言的田野调查数据,核心内容是该语言名词和动词词干的提取结果,仅包含一个文件,无目录结构和数据拆分。 文件详解 文件名称:PTA_2017_01_02.xlsx 文件格式:XLSX 字段映射介绍:因无内容预览,推测包含Paĩ Tavyterã...
    packageimg
  • El_habla_La_Pola_Siero_阿斯图里亚斯地图问题6口语语料数据

    2026年1月15日   

    数据集概述 本数据集为与阿斯图里亚斯地图相关的第6个问题的口语语料,源自El habla La Pola Siero语料库。数据集仅包含一个文档文件,无训练测试、数据标签或原始处理数据的划分,文件类型单一为docx格式。 文件详解 文件名称:Mapa de Asturias.Pregunta6.docx 文件格式:DOCX...
    packageimg
  • musiXplora_Source_Max_Adam_a1357_音乐家档案数据

    2026年1月15日   

    数据集概述 本数据集为音乐家Max Adam(musiXplora-...
    packageimg
  • musiXplora_Giuseppe_Crudeli_c0745_音乐家档案数据

    2026年1月15日   

    数据集概述 本数据集为音乐家Giuseppe Crudeli(musiXplora-ID:c0745)的结构化档案信息,包含其基本身份信息、职业领域、活动地点、相关文献及事件记录等内容,以JSON格式存储,为音乐历史研究提供标准化的人物数据支持。 文件详解 文件名称:c0745_DE.json 文件格式:JSON...
    packageimg