-
布纳克语文本数据集_Schapper_2010
数据集概述 该数据集包含用于Schapper 2010年博士论文的布纳克语文本及相关说话人信息,布纳克语是帝汶中部的一种巴布亚语言,为研究该语言提供基础文本资料。 文件详解 文件名称: BunaqTextsSchapper2010.pdf 文件格式: PDF (.pdf) 文件内容: 记录了布纳克语的文本内容及其说话人信息,是Schapper...
-
所有者与论元索引重合的类型学调查数据集
数据集概述 本数据集是论文《When possessor and argument indexes coincide. A typological survey》的支撑数据,包含类型学调查的核心内容,可用于研究所有者与论元索引重合现象,还附带说明文档解释相关决策。 文件详解 文件名称:...
-
英语到乌兹别克语翻译中多成分复合句的转换研究
数据集概述 本数据集包含一篇关于英语到乌兹别克语翻译中多成分复合句转换研究的PDF文档,聚焦多成分复合句在跨语言翻译中的结构变化与处理方式。 文件详解 文件名称: A.A.Latibjonov.pdf 文件格式: PDF (.pdf) 文件内容: 该文档为研究论文,主题围绕英语多成分复合句在乌兹别克语翻译中的转换规律展开。 适用场景 翻译理论研究:...
-
哥廷根印度语言电子文本注册库_罗摩衍那数据集
数据集概述 本数据集是哥廷根印度语言电子文本注册库(GRETIL)中关于《罗摩衍那》(Rāmāyaṇa)的电子文本集合,包含多个章节或版本的文本文件,为印度古典文学研究提供基础资料。 文件详解 该数据集由13个HTML格式文件组成,具体如下: -...
-
图皮语依存树库数据集
数据集概述 本数据集是图皮语依存树库(TuDeT),包含一个压缩文件,提供图皮语语言资源,用于自然语言处理(NLP)相关研究,为图皮语的句法分析提供数据支持。 文件详解 文件名称: tupian-language-resources/tudet-v0.4.zip 文件格式: ZIP(压缩文件) 内容说明:...
-
乌兹别克语PDF文档数据集
数据集概述 本数据集包含一份乌兹别克语PDF文档,文档标题涉及学习对异常行为表现的影响相关主题,为相关领域的文本分析或内容研究提供基础资料。 文件详解 文件名称:Qurbonova Aziza Davlat qizi.pdf 文件格式:PDF(.pdf)...
-
Tokha_Inscription_Based_IN02035_托卡铭文译文完整数据
数据集概述 本数据集包含IN02035编号的托卡铭文译文资料,提供了与该铭文相关的两种格式文档,为研究该铭文的文字内容及背景信息提供了数据支持。 文件详解 该数据集包含两个文档文件,具体说明如下: - 文件名称: IN02035 LXI Inscription of Tokha.pdf - 文件格式: PDF (.pdf) - 内容说明:...
-
多成分复合句综合分析数据集
数据集概述 该数据集围绕多成分复合句展开综合分析,核心内容为一份PDF格式的研究文档,为语法结构、句子类型等语言研究方向提供基础资料。 文件详解 文件名称:Nazarova Sevarakhon Jakhongir kizi.pdf 文件格式:PDF 内容说明:包含关于多成分复合句的综合性分析内容,具体字段或章节需通过文档阅读获取 适用场景...
-
英语条件句及其用法数据集
数据集概述 本数据集包含一份关于英语条件句及其用法的PDF文档,核心内容围绕英语条件句的结构、类型及实际应用场景展开,为学习或研究英语语法中条件句的使用规则提供参考资料。 文件详解 文件名称: Gafurova Nodira Ravshanovna.pdf 文件格式: PDF 内容说明:...
-
语言学华莱士地区可分不可让渡编码补充材料数据集
数据集概述 本数据集为论文《语言学华莱士地区可分不可让渡编码:类型学、起源与传播》的补充材料,包含用于研究的数据集文件及样本语言和来源说明文档,支持对该语言学现象的分析与验证。 文件详解...
-
藏语古典词性标注词汇表
数据集概述 该数据集是为自然语言处理(NLP)任务构建的藏语古典词性标注词汇表。数据来源于动词词干数字化版本及人工标注的训练数据,部分词汇通过手动添加以优化基于规则的词性标注,适用于藏语古典文本的词性分析与处理。 文件详解 文件名称: Lexicons.zip 文件格式: ZIP压缩包 内容说明:...
-
C文件的JSON抽象语法树数据集
数据集概述 本数据集提供了一个C语言文件的抽象语法树(AST),以JSON格式存储。该C文件是从Software Heritage平台的热门代码片段中,依据AST大小随机选取的,为代码结构分析提供基础数据。 文件详解 文件名称: ast.json 文件格式: JSON (.json) 内容说明:...
-
LaTeX文档分析数据集LaTeXDocumentAnalysisDataset-sai1881
LaTeX文档分析数据集LaTeXDocumentAnalysisDataset-sai1881 数据来源:互联网公开数据 标签:LaTeX, 文档分析, 数据集, 语法结构, 文学研究, 自然语言处理, 计算机科学, 学术资源 数据概述:...
-
西班牙国会发言标点检测数据集
西班牙国会发言标点检测数据集 数据来源:互联网公开数据 标签:西班牙国会,标点符号检测,自然语言处理,文本分析,语料库,语法结构,语言模型,文本分类 数据概述: 本数据集收录了2011年至2020年间西班牙国会议员的完整发言记录,按发言人分段整理。每句话被拆分为单个单词,并根据以下标准进行分类: 1....
-
文本特征提取数据集1963-2021
文本特征提取数据集1963-2021 数据来源:互联网公开数据 标签:文本特征,自然语言处理,情感分析,可读性分析,语法结构,词性标注,命名实体识别 数据概述:...



