哥廷根印度语言电子文本注册库_数论派文献集

数据集概述

该数据集是哥廷根印度语言电子文本注册库(GRETIL)的一部分,聚焦于印度哲学数论派(SAṂKHYA)相关文献,包含十八个HTML格式文件,未区分训练测试、数据标签或原始处理数据。

文件详解

  • 核心文件:
  • 文件类型: 所有文件均为HTML格式(.htm),共十八个文件
  • 文件示例: tsc_simu.htm、kestprau.htm、iskamatu.htm、tttvsamu.htm、yuktdipu.htm、tatsuvru.htm、tsc_vivu.htm、iskgaudu.htm等
  • 结构说明: 无目录层级(目录深度为零),未检测到统一命名模式

数据来源

GRETIL - Göttingen Register of Electronic Texts in Indian Languages

适用场景

  • 印度哲学研究: 用于数论派哲学文献的数字化整理与文本分析
  • 梵语语言学研究: 分析数论派文献中的梵语语法、词汇特征
  • 数字人文研究: 构建印度古典文献数字化语料库,支持文本挖掘
  • 比较哲学研究: 提取数论派核心概念,与其他哲学流派进行对比分析
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1.44 MiB
最后更新 2025年12月8日
创建于 2025年12月8日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。