找到18个数据集

标签: 文本研究

过滤结果
  • 多语种越狱数据集

    2026年2月15日 30 160 29

    数据集概述 本数据集为多语种越狱数据集,包含一个Excel文件,未进行训练/测试、数据/标签、原始/处理等数据拆分,未提供自述文件或内容预览,可用于多语种文本相关的研究与分析。 文件详解 文件名称:多语种越狱数据集.xlsx 文件格式:XLSX 字段映射介绍:未提供内容预览,具体字段信息暂不明确 适用场景 多语种文本数据挖掘:...
    packageimg
  • TripAdvisor_Based_TripAdvisor基础数据

    2026年1月27日 30 162 44

    数据集概述 本数据集为TripAdvisor基础数据,包含六个文件,涉及关键词频率、词聚类、出现"day"的短语及结果文档等内容,主要用于文本相关的分析研究,涵盖Excel、Word、CSV三种格式,以Excel文件为主。 文件详解 body_tablafrecuencias_palabras_clave.xlsx 文件格式:XLSX...
    packageimg
  • DH_RSE_2024年夏季学校研讨会第三组_莎士比亚作品文本分析数据压缩包

    2026年1月20日 30 152 42

    数据集概述 本数据集为基于文本分析的莎士比亚作品语言特征研究相关数据,以压缩包形式提供,包含1个文件,无目录结构,未区分训练/测试、数据/标签或原始/处理数据,可用于莎士比亚作品语言特征的分析研究。 文件详解 文件名称:DH-RSE-Summer-School-2024-Workshop-Team3-main.zip 文件格式:ZIP...
    packageimg
  • IN02092_Epidoc_Based巴希利托尔帕坦铭文梵语XML草稿数据

    2026年1月20日 30 99 13

    数据集概述 本数据集包含IN02092巴希利托尔帕坦铭文的梵语XML文件,为Epidoc格式的草稿版本,不含元数据,计划纳入“Siddham”档案。数据集仅含一个文件,聚焦铭文文本的数字化编辑内容。 文件详解 文件名称:IN02092.xml 文件格式:XML...
    packageimg
  • 哥廷根印度语言电子文本注册库_吠檀多数据集

    2025年12月24日 30 8 3

    数据集概述 该数据集是哥廷根印度语言电子文本注册库(GRETIL)中关于吠檀多(VEDĀNTA)主题的电子文本集合,包含六十一个HTML格式的文本文件,未划分目录结构,为印度语言吠檀多相关文本研究提供基础资料。 文件详解...
    packageimg
  • 乌兹别克文学作品中母亲形象比较研究_乌特基尔_霍希莫夫与阿哈姆德_卢特菲_卡赞奇作品分析

    2025年12月22日 30 1 0

    数据集概述 该数据集聚焦乌兹别克文学领域,以乌特基尔·霍希莫夫《世界之事》与阿哈姆德·卢特菲·卡赞奇《乌盖母亲》两部作品为研究对象,对其中的母亲形象进行比较分析,通过微观与宏观视角结合的方式呈现文学意象解读成果。 文件详解 该数据集包含一个PDF格式的文档文件,具体如下: - 文件名称: Дилфуза Расулмухамедова.pdf -...
    packageimg
  • KONSTITUTSIYA_INSON_HUQUQLARI_ERKINLIKLARI_Based_人类权利与自由宪法保障完整数据

    2025年12月19日 30 84 66

    数据集概述 该数据集包含一份以“人类权利与自由宪法保障”为主题的文档,核心内容围绕宪法框架下的人权与自由保障体系展开,为相关法律或社会研究提供资料支持。 文件详解 文件名称: Muptillaeva Naubaxar Nurabulla kizi.pdf 文件格式: PDF (.pdf) 文件内容: 文档主题为“KONSTITUTSIYA INSON...
    packageimg
  • Akmaljon_Mamarasulov_XALQ_MAQOLLARIDA_KOSMONINLARNING_IFODALANISHI_Based_民间文章...

    2025年12月19日 30 185 151

    数据集概述 该数据集包含一份关于民间文章中宇航员形象表现的PDF文档,核心围绕民间创作中对宇航员的描述与呈现展开,为相关主题研究提供基础资料。 文件详解 文件名称: Akmaljon Mamarasulov .pdf 文件格式: PDF (.pdf) 文件内容: 文档主题为“XALQ MAQOLLARIDA KOSMONINLARNING...
    packageimg
  • ར_བཞ_ད_Ziling_2011_Based_人文研究标注转录分析完整数据

    2025年12月18日 30 161 71

    数据集概述 该数据集为རྦ་བཞེད་(Ziling 2011)的标注转录文档,以PDF格式存储,包含对特定内容的转录与标注信息,为相关文本研究提供基础数据支持。 文件详解 文件名称:རྦ་བཞེད་ Ziling 2011.pdf 文件格式:PDF (.pdf) 文件内容:该文档是རྦ་བཞེད་(Ziling...
    packageimg
  • 与古代世界对话_阿维斯塔与雅利安人

    2025年12月4日 30 64 28

    数据集概述 该数据集包含一份关于“阿维斯塔与雅利安人”主题的PDF文档,围绕古代文献《阿维斯塔》与雅利安人群体的关联展开内容,为研究古代文明相关主题提供资料支持。 文件详解 文件名称: Faizullaeva Z.B.pdf 文件格式: PDF (.pdf) 文件内容: 文档围绕“阿维斯塔与雅利安人”主题展开,具体内容需查阅PDF文件获取 适用场景...
    packageimg
  • M_S_CORNELIS_PRINS航运日志第一部分_法规1968_1981

    2025年12月12日 30 205 138

    数据集概述 该数据集为1968至1981年间记录的M.S.CORNELIS PRINS航运日志第一部分,包含前50页的德、荷、法三语法规内容,已数字化供文本研究,后续日志部分将逐步开放。 文件详解 1202.pdf:PDF格式文档,为M.S.CORNELIS PRINS航运日志第一部分的数字化文件,包含1968-1981年间的德、荷、法三语法规内容。...
    packageimg
  • Ziling2011_ར_བཞ_ད_Based_历史手稿注释完整数据

    2025年12月11日 30 202 9

    数据集概述 该数据集为2011年从Ziling发布的རྦ་བཞེད་手稿传真件的注释版本,以PDF格式存储,包含手稿相关的注释内容。 文件详解 文件名称:རྦ་བཞེད་ MS.pdf 文件格式:PDF 内容说明:手稿传真件的注释版本,无细分字段信息 适用场景 手稿文本研究 文献注释分析 相关历史文化内容探究
    packageimg
  • 黑姑娘_白姑娘_小说中主人公冲突心理分析数据集

    2025年12月11日 30 1 0

    数据集概述 本数据集为单篇PDF文档,内容围绕小说《黑姑娘/白姑娘》中主人公在美国现实背景下的心理冲突展开分析,是研究文学作品中人物心理与社会现实关联的资料。 文件详解 文件名称: Эльманова Мастура Тошназаровна.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • MATNGA_LINGVOMADANIY_VA_LINGVOPOETIK_YONDASHUV_Based_文本语言文化诗学研究完整数据

    2025年12月10日 30 33 19

    数据集概述 本数据集包含一份关于文本的语言文化与语言诗学研究文档,以PDF格式呈现,为相关领域的学术研究提供基础资料。 文件详解 文件名称: Xolisxon Akbarova.pdf 文件格式: PDF (.pdf) 内容说明:...
    packageimg
  • 展览引言面板文本研究数据集2022

    2025年12月9日 30 98 44

    数据集概述 本数据集包含两个展览引言面板的完整文本,用于支持“博物馆展览中的文本处理”相关研究。数据来源于2022年查理大学哲学系信息研究与图书馆学研究所的学士学位论文,后续成为专业论文《展览引言面板:文本定量分析与观众感知》的基础。 文件详解 文件名称: vyzkumne-texty.pdf 文件格式: PDF (.pdf) 内容说明:...
    packageimg
  • 狄更斯_大卫_科波菲尔_中父亲形象的话语分析

    2025年12月7日 30 26 11

    数据集概述 本数据集包含一份PDF文档,内容为关于查尔斯·狄更斯小说《大卫·科波菲尔》中父亲形象的话语分析研究,为文学文本分析提供参考资料。 文件详解 文件名称: Sanjar Kurbanov.pdf 文件格式: PDF (.pdf) 文件内容: 该文档是一份关于《大卫·科波菲尔》中父亲形象的话语分析研究报告,具体内容需查阅文档全文。 适用场景...
    packageimg
  • 希伯来十诫大理石碑数据集

    2025年12月7日 30 32 31

    数据集概述 本数据集围绕希伯来文十诫(Decalogue)的大理石碑展开,包含相关的三维模型文件和图片文件,记录了十诫的具体内容,为研究十诫文本及相关载体提供基础数据支持。 文件详解 三维模型文件: d5eace1ecc414b89aefcffffd0edc861.glb:GLB格式,为希伯来十诫大理石碑的三维模型文件 图片文件:...
    packageimg
  • 摩门经信息提取版数据集

    2025年4月14日 30 181 102

    摩门经信息提取版数据集 数据来源:互联网公开数据 标签:摩门经,宗教文本,自然语言处理,主题建模,文本研究,文化研究 数据概述: 该数据集包含了《摩门经》的文本内容,该文本来源于美国在线图书馆的Project...
    packageimg