哥廷根印度语言电子文本注册中心_奥义书数据集

数据集概述

该数据集是哥廷根印度语言电子文本注册中心(GRETIL)收录的奥义书(UPANIṢAD)相关电子文本集合,包含三十五个HTML格式文件,无目录层级结构,未划分训练测试、数据标签或原始处理数据。

文件详解

  • 文件类型:均为HTML格式(.htm),共三十五个文件
  • 文件示例:mand_upu.htm、agsas_3u.htm、brupsb3u.htm、chup___u.htm、mandup_u.htm、svetu_iu.htm、brupsb1u.htm、isupsb_u.htm
  • 无检测到命名模式,无目录结构,无README或内容预览

数据来源

哥廷根印度语言电子文本注册中心(GRETIL)

适用场景

  • 印度古典文献研究:用于奥义书文本的数字化整理与分析
  • 语言学研究:支持对印度古典语言文本的语法、词汇特征研究
  • 宗教哲学研究:为奥义书相关宗教哲学思想的学术研究提供原始文本素材
  • 数字人文研究:适用于古典文本数字化存储、检索与文本挖掘分析场景
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 3.86 MiB
最后更新 2025年12月11日
创建于 2025年12月11日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。