找到9个数据集

标签: 语言特征研究

过滤结果
  • CLDF_Based_Gran_Chaco区域语言比较词表数据集2022

    2026年1月22日 30 163 66

    数据集概述 本数据集为CLDF格式,对应Brid等人2022年发布的《Gran Chaco区域语言比较词表》,包含该区域语言的比较词表信息,是研究Gran Chaco地区语言特征的结构化数据资源,共含一个文件。 文件详解 压缩包文件 文件名称:lexibank/chacolanguages-v0.3.zip 文件格式:ZIP...
    packageimg
  • IN02001_Based_昌古纳拉扬石柱东轴梵语铭文XML数据_Draft

    2026年1月20日 30 111 52

    数据集概述 本数据集包含IN02001昌古纳拉扬石柱东轴铭文的梵语文本,以XML格式存储,为Epidoc标准的草稿版本,计划纳入Siddham档案。数据无元数据,仅包含一份核心文件,用于铭文的数字化保存与研究。 文件详解 核心文件 文件名称:IN02001.xml 文件格式:XML...
    packageimg
  • Hofdiarium_1665_Based德累斯顿宫廷日记库兰特手写体基准数据集

    2026年1月19日 30 147 52

    数据集概述 本数据集为17世纪萨克森库兰特手写体的手写文本识别(HTR/OCR)基准数据集,包含《选帝侯约翰·格奥尔格二世1665年宫廷日记》(SLUB Mscr.Dresd.K.80)的10页(fol.85r-89v)基准数据,采用eScriptorium完成图像与文本对齐,提供多种格式文件及转录指南。 文件详解 压缩包文件...
    packageimg
  • IN02074_EpiDoc_Siddham档案用Kasaintole铭文梵语XML草稿数据

    2026年1月12日 30 20 18

    数据集概述 本数据集包含IN02074 Kasaintole铭文的梵语XML文件,为EpiDoc格式草稿版,将纳入“Siddham”档案。文件无元数据,仅包含一份XML格式的铭文文本数据,用于铭文文献的数字化保存与研究。 文件详解 文件名称:IN02074.xml 文件格式:XML...
    packageimg
  • IN02062_EpiDoc_Bhimarjunadeva_Thankot铭文梵语XML草稿数据

    2026年1月9日 30 148 110

    数据集概述 本数据集包含IN02062编号的Bhimarjunadeva Thankot铭文的梵语文本数据,以XML格式存储,为EpiDoc标准的草稿版本,计划纳入Siddham档案。数据无元数据,仅包含一份文件,用于铭文文献的数字化保存与研究。 文件详解 文件名称:IN02062.xml 文件格式:XML...
    packageimg
  • 中古低地德语_Flos_unde_Blankeflos_数字外交版本与图像数据集

    2025年12月20日 30 114 106

    数据集概述 本数据集包含四部中古低地德语《Flos unde Blankeflos》手稿的数字外交版本与图像数据,采用Transkribus平台生成转录文本,提供ALTO XML、PAGE XML格式文件及数字图像、元数据,便于手稿文本与版式分析。 文件详解 手稿压缩文件(共4个):...
    packageimg
  • 乌兹别克语词汇替换特征研究文献

    2025年12月6日 30 104 5

    数据集概述 本数据集包含一篇关于乌兹别克语词汇替换特征研究的文献资料,以PDF格式呈现,围绕词汇替换的相关特性展开分析,为乌兹别克语语言特征研究提供参考。 文件详解 文件名称: Xuramova D.R.pdf 文件格式: PDF(.pdf) 文件内容:...
    packageimg
  • childPoeDE_德国儿童诗歌计算与实验研究元数据

    2025年12月5日 30 147 132

    数据集概述 该数据集是CHYLSA项目下的childPoeDE语料库元数据,包含一千零八十二首1991至2019年出版的德国儿童诗歌的元数据,涵盖诗歌层面(作者、长度、韵律等)、词元层面(词性、拟声词等)信息,以及词频表和处理脚本等。 文件详解 数据文件(CSV格式):...
    packageimg
  • 学术_小说与歌曲语言数据集

    2025年12月5日 30 203 10

    数据集概述 该数据集为研究项目“学术、小说与歌曲中的语言”的数据管理计划(DMP)。核心内容围绕学术写作、小说文本与歌曲歌词中的动词使用差异展开,对比不同体裁及文本内的动词多样性,分析各体裁高频动词特征。 文件详解 文件名称:DMP_Language in academics fiction and song.pdf 文件格式:PDF (.pdf)...
    packageimg