哥廷根印度语言电子文本注册库诗歌数据集

数据集概述

该数据集是哥廷根印度语言电子文本注册库(GRETIL)中的诗歌文本集合,包含二百二十六份HTML格式的文件,未进行训练测试、数据标签或原始处理的拆分,文件类型统一为网页格式。

文件详解

该数据集包含二百二十六份HTML格式文件,具体说明如下: - 文件类型:所有文件均为HTML格式(.htm),占比百分之百 - 文件示例:包含gp12-22u.htm、jvrtmsiu.htm、jalmugpu.htm、damkuttu.htm、ruphamdu.htm、asvbc_1u.htm、ksbhm07u.htm、maghspvu.htm等文件 - 数据结构:未检测到命名模式,无目录层级,未提供README文件或内容预览

数据来源

哥廷根印度语言电子文本注册库(GRETIL)

适用场景

  • 印度语言文学研究:用于分析印度语言诗歌的文本特征、文学风格及语言结构
  • 数字人文研究:支持印度诗歌电子文本的数字化存档、检索与比较分析
  • 语言学研究:为印度语言的语法、词汇及语用研究提供原始文本素材
  • 文化研究:辅助探索印度诗歌所反映的历史文化背景与社会思想
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 53.2 MiB
最后更新 2025年12月5日
创建于 2025年12月5日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。