哥廷根印度语言电子文本注册_ŚRAUTA数据集

数据集概述

本数据集是GRETIL平台收录的印度语言电子文本注册中关于ŚRAUTA主题的文本集合,包含5个HTML格式文件,未区分训练/测试、数据/标签或原始/处理数据,文件类型单一。

文件详解

  • 文件名称与格式:包含5个.htm格式文件,具体为asvss_u.htm、sankhssu.htm、vaitss_u.htm、apsulbcu.htm、apsulb_u.htm
  • 文件类型分布:所有文件均为.htm格式,占比百分之百
  • 数据结构:未检测到命名模式,无目录层级,未区分训练/测试、数据/标签或原始/处理数据

数据来源

GRETIL - Göttingen Register of Electronic Texts in Indian Languages

适用场景

  • 印度语言文学研究:用于分析ŚRAUTA主题相关的印度语言电子文本内容
  • 数字人文研究:可作为印度古典文献数字化资源进行文本挖掘与分析
  • 语言学研究:为印度语言语法、词汇等语言学特征研究提供文本数据支持
  • 宗教与文化研究:适用于探究ŚRAUTA相关的宗教仪式、文化传统等内容
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1.58 MiB
最后更新 2025年12月11日
创建于 2025年12月11日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。