-
哥廷根印度语言电子文本注册库诗歌数据集
2025年12月5日 30 90 43
数据集概述 该数据集是哥廷根印度语言电子文本注册库(GRETIL)中的诗歌文本集合,包含二百二十六份HTML格式的文件,未进行训练测试、数据标签或原始处理的拆分,文件类型统一为网页格式。 文件详解 该数据集包含二百二十六份HTML格式文件,具体说明如下: - 文件类型:所有文件均为HTML格式(.htm),占比百分之百 -...
-
哥廷根印度语言电子文本注册中心湿婆文献数据集
2025年12月4日 30 48 7
数据集概述 该数据集为哥廷根印度语言电子文本注册中心(GRETIL)收录的湿婆文献,包含八十二份HTML格式文件,覆盖湿婆教相关文本内容,为印度语言文学与宗教研究提供基础文本资源。 文件详解 文件类型:以.htm格式为主,共82个文件,占比百分之百...
-
对话与文学风格文本数据集
2025年4月18日 30 29 0
对话与文学风格文本数据集 数据来源:互联网公开数据 标签:对话风格,文学风格,文本风格转换,俄语数据,自然语言处理,机器学习,语言模型 数据概述:...



