哥廷根印度语言电子文本注册处词典学数据集

数据集概述

该数据集是哥廷根印度语言电子文本注册处(GRETIL)下的词典学相关数据,主要包含四个HTML格式的文件,未区分训练/测试集、数据/标签集或原始/处理数据,文件类型单一。

文件详解

  • 数据集包含4个HTML格式文件,具体如下:
  • 文件名称:amark2_u.htm、amark3_u.htm、amark1pu.htm、amark1hu.htm
  • 文件格式:HTML (.htm)
  • 说明:未提供文件内容预览,文件功能及内部字段信息需通过访问文件本身获取

适用场景

  • 印度语言研究:可用于分析特定印度语言的词汇结构、语义关系或语言演变
  • 词典编纂研究:为词典学领域提供印度语言相关的电子文本数据支持
  • 语言学教学:作为印度语言词汇教学的辅助资料
  • 数字人文研究:助力探索印度语言电子文本的数字化存储与应用模式
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.31 MiB
最后更新 2025年12月6日
创建于 2025年12月6日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。