找到3个数据集

标签: 历史语料

过滤结果
  • 德语历时词用法图发现数据集

    2025年12月19日 30 194 23

    数据集概述 该数据集包含针对德语的历时词用法图(WUGs)发现数据。词用法日期对应语料库时间段中点(1800-1899、1946-1990),非文档精确日期,为德语词汇语义变化研究提供数据支持。 文件详解 文件名称: discowug.zip:该文件为压缩包格式,内部包含德语历时词用法图的相关数据。具体字段及结构需解压后查看,数据格式未提供预览信息。...
    packageimg
  • Heliand_Parsed_Based_古撒克逊语Heliand文本解析完整数据

    2025年12月7日 30 44 35

    数据集概述 该数据集包含古撒克逊语福音书《Heliand》C手稿的五千九百六十八行内容,采用Sievers(一八七八年)版本,相比Behaghel标准版更适合语言学研究。数据集以UTF-8纯文本格式设计,遵循Penn历史英语语料库格式,支持CorpusSearch...
    packageimg
  • 希腊议会二战后会议记录分析与识别数据集1946_1947

    2025年12月5日 30 111 69

    数据集概述 该数据集通过文本识别与自然语言处理技术,解锁1946-1947年希腊议会会议记录的历史语料。包含经Transkribus训练的文本识别模型处理的3156张扫描图像,以及通过语言模型优化、信息提取技术分析的演讲数据,首次量化了获得掌声的议题。 文件详解 文件名称: README.md,文件格式: Markdown,内容:...
    packageimg