哥廷根印度语言电子文本登记薄_摩诃婆罗多数据集

数据集概述

该数据集是哥廷根印度语言电子文本登记薄(GRETIL)中关于《摩诃婆罗多》(MAHĀBHĀRATA)的电子文本集合,包含十九个HTML格式文件,无目录结构,文件命名无明显规律,未区分训练/测试、数据/标签或原始/处理数据。

文件详解

  • 核心文件:
  • 包含19个HTML格式文件,文件名称示例:mbh_12_u.htm、mbh_16_u.htm、mbh_13_u.htm、mbh_10_u.htm、mbh_07_u.htm、mbh_18_u.htm、mbh_11_u.htm、mbh_06_u.htm等
  • 文件格式:.htm(共19个,占比百分之百)
  • 无README或内容预览文件

适用场景

  • 印度古典文学研究:用于《摩诃婆罗多》文本的数字化分析与文献学研究
  • 数字人文研究:探索印度史诗的电子文本呈现与传播模式
  • 语言学分析:辅助研究古印度语言在史诗文本中的应用特征
  • 文化遗产保护:为《摩诃婆罗多》的数字化保存与传承提供基础数据支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 32.18 MiB
最后更新 2025年12月18日
创建于 2025年12月18日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。