早期现代拉丁炼金术印刷品语料库数据集_EMLAP

数据集概述

本数据集记录早期现代拉丁炼金术印刷品语料库,包含精选数字转录样本、元数据目录、带自动形态标注的句子数据、词形还原句子及预处理脚本,用于自动隐喻检测等文本分析研究。

文件详解

  • 文件名称: CCS-ZCU/EMLAP_ETL-v0.5.zip
  • 文件格式: ZIP压缩包
  • 包含内容: 精选数字转录样本、元数据目录、带形态标注的句子数据、词形还原句子数据、文本预处理脚本

数据来源

GitHub(https://github.com/CCS-ZCU/EMLAP_ETL

适用场景

  • 历史语言学研究:分析早期现代拉丁语文本的语言特征与演变
  • 炼金术史研究:通过数字化语料库探索炼金术文献的内容与传播
  • 计算语言学应用:用于自动隐喻检测、文本分类等自然语言处理任务
  • 数字人文研究:支持远距离阅读、混合阅读等计算分析方法的应用
  • 语料库语言学:构建专业化历史语料库并开发专用数据库界面
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 118.46 MiB
最后更新 2025年12月5日
创建于 2025年12月5日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。