找到3个数据集

标签: 原始文本

过滤结果
  • IN02071_德奥帕坦碑铭翻译数据集

    2025年12月4日 30 107 91

    数据集概述 本数据集包含IN02071德奥帕坦碑铭的翻译文档,以两种格式呈现,为研究该碑铭内容提供文本资料支持。 文件详解 文件名称:IN02071 CXVIII Deopatan Inscription.docx 文件格式:DOCX 内容说明:德奥帕坦碑铭的翻译文档,为可编辑的文字处理格式 文件名称:IN02071 CXVIII Deopatan...
    packageimg
  • 哥廷根印度语言电子文本注册_阿兰亚卡数据集

    2025年12月4日 30 177 28

    数据集概述 本数据集是哥廷根印度语言电子文本注册(GRETIL)中关于阿兰亚卡(ĀRAṆYAKA)的电子文本资源,包含一个HTML格式的文本文件,为印度语言相关的文献研究提供原始文本数据支持。 文件详解 文件名称: sankharu.htm 文件格式: HTML (.htm) 内容说明:...
    packageimg
  • 无词干提取文本数据集DatasetTanpaStemming-skripsheet

    2025年4月26日 30 124 42

    无词干提取文本数据集DatasetTanpaStemming-skripsheet 数据来源:互联网公开数据 标签:文本分析,数据集,自然语言处理,机器学习,文本处理,信息检索,语言技术,数据分析 数据概述: 该数据集包含未进行词干提取处理的文本数据,记录了原始文本的完整形态。主要特征如下: 时间跨度:...
    packageimg