-
REWIND_Corpus_Based_拉丁美洲女性作家文本数字化完整数据
数据集概述 该数据集为REWIND语料库,收录了20世纪二战前拉丁美洲女性作者以西班牙语出版的书籍文本。作者均曾赴欧洲多国旅行,认同女权主义并支持混血文化,包括Clorinda Matto等五位作家,旨在从去殖民性别理论框架研究其跨文化解读。 文件详解 索引文件(XML格式): rewind_object_index.xml:对象索引文件...
-
多语言合成出院小结数据集_基于心力衰竭临床病例
数据集概述 该数据集包含一千份心脏病学临床病例报告及其对应的多语言合成出院小结,覆盖英语、西班牙语和荷兰语三种语言。小结由GPT-4o-mini通过零样本提示生成并翻译,旨在为临床自然语言处理系统提供训练与评估数据支持。 文件详解 根目录文件: MultiSynDS.zip: 压缩文件,包含数据集所有内容 子目录结构:...
-
西班牙语COVID_19推文职业检测黄金标准标注数据集2021
数据集概述 本数据集包含一万条带黄金标准标注的西班牙语COVID-19推文,按训练集、验证集、测试集以六十比二十比二十比例划分,涵盖职业分类与命名实体识别两个子任务的标注数据,同时提供多格式文件及工具脚本,支持自然语言处理模型训练与评估。 文件详解 数据集为压缩包格式,包含两个子任务相关文件,具体说明如下: - subtask-1(职业分类子任务):...
-
智利等待列表临床语料库
数据集概述 该数据集是基于智利公立医院等待列表匿名转诊记录构建的临床语料库,包含九千份医疗和牙科转诊记录,经专业人员手动标注十种实体、六种属性及临床相关关系对,超百分之四十八的实体存在嵌套或包含关系,是首个智利西班牙语临床叙事标注语料库。 文件详解 文件名称: LICENSE.txt:文件格式为TXT,内容为知识共享署名-非商业性使用-...
-
小学四年级与六年级阅读理解和听力理解测试题集
数据集概述 该数据集包含小学四年级和六年级的阅读理解与听力理解测试题,覆盖西班牙语和英语两个语种,所有文件均为PDF格式的完整测试卷,为小学阶段语言能力评估提供标准化测试材料。 文件详解 该数据集包含8个PDF格式的测试题文件,具体说明如下: - 4º Primaria_Castalleno_Comprensión oral_Prueba...
-
西班牙语历时词用法图数据集DWUG_ES
数据集概述 该数据集包含西班牙语的历时词用法图(WUGs),提供词用法随时间变化的结构化数据,支持语义变化研究。版本为4.0.2,含修正后的词上下文、索引及匿名化标注,通过压缩包形式存储。 文件详解 文件名称:dwug_es.zip 文件格式:ZIP压缩包...
-
西班牙语医学缩写数据库AbreMES_DB
数据集概述 该数据集是西班牙语医学缩写数据库(AbreMES-DB),通过自动检测生物医学出版物元数据中缩写及其同句显式定义构建,旨在形成用于缩写定义解析的语义资源库。 文件详解 文件名称: AbreMES-DB.zip 文件格式: ZIP压缩包(.zip) 内容说明:...
-
MEDDOPROF语料库训练集与补充实体数据集
数据集概述 该数据集为MEDDOPROF共享任务资源,包含西班牙语临床病例中职业与就业状态检测的训练数据及补充实体标注。数据集支持职业提及识别、分类和归一化三个子任务,适用于自然语言处理相关研究与应用。 文件详解 文件名称: meddoprof-training-set.zip 文件格式: ZIP压缩包 (.zip) 文件内容:...
-
西班牙卡斯特利翁地区小学五年级学生学业成绩评估数据集2013_2014
数据集概述 该数据集包含2013-2014学年春季在西班牙卡斯特利翁地区四所公立学校收集的小学五年级学生学业成绩评估数据。评估覆盖数学、西班牙语、瓦伦西亚语、自然与社会科学、英语、艺术教育、体育七个领域,成绩采用1-5分制(1为不及格,5为优秀),为分析该群体学业表现提供结构化数据支持。 文件详解 数据文件:...
-
西班牙卡斯特利翁小学四年级期末学业成绩评估数据集2012_2013
数据集概述 本数据集记录了2012-2013学年春季,西班牙卡斯特利翁四所公立学校小学四年级学生的期末学业成绩评估结果,涵盖数学、西班牙语、瓦伦西亚语等七个学科领域,成绩采用1至5分的评分标准。 文件详解 数据文件: GRADES_Data_CC_T4-Post.sav:...
-
圣乔治礼拜堂_加泰罗尼亚政府宫数据集
数据集概述 该数据集包含圣乔治礼拜堂(位于加泰罗尼亚政府宫)的多语言描述文本及相关文件。礼拜堂建于1432-1434年,后经多次改建,数据提供了其历史背景与位置信息,支持建筑历史与文化遗产研究。 文件详解 文件名称: 17ac134428b24eda892557de6406a93f.glb 文件格式: GLB (.glb) 内容说明:...
-
SympTEMIST症状体征信息抽取标注数据集
数据集概述 该数据集是针对西班牙语文档中症状、体征和检查结果进行信息抽取的标注资源,包含任务训练测试集、SNOMED术语词表、九种语言的银标准数据及一万五千余例临床病例背景集,为医学文本挖掘研究提供标准化标注数据。 文件详解 文件名称: symptemist-complete_240208.zip 文件格式: ZIP压缩包 包含内容:...
-
多语言文本嵌入与翻译数据集
多语言文本嵌入与翻译数据集_Multilingual_Text_Embedding_and_Translation_Dataset 数据来源:互联网公开数据 标签:文本嵌入, 词向量, 机器翻译, 英语, 西班牙语, 语料库, 自然语言处理, 数据集 数据概述:...
-
欧盟多语言翻译文本数据集
欧盟多语言翻译文本数据集_Multilingual_Translation_Text_Dataset 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 语言学, 文本数据, 英语, 西班牙语, 意大利语, 文本对齐 数据概述: 该数据集包含来自欧盟官方文档的翻译文本,记录了英语与西班牙语、英语与意大利语之间的对应翻译。主要特征如下:...
-
多语言恶意评论检测数据集
多语言恶意评论检测数据集_Multilingual_Toxic_Comment_Detection_Dataset 数据来源:互联网公开数据 标签:文本分类, 恶意评论, 毒性分析, 俄语, 西班牙语, 自然语言处理, 情感分析, 机器学习 数据概述:...
-
COVID-19西班牙语推文数据集
COVID-19西班牙语推文数据集 数据来源:互联网公开数据 标签:COVID-19, 西班牙语, 推文, 时间序列, 文本分析, 情感分析, 传播趋势 数据概述:...
-
越南语-西班牙语平行语料数据集Vietnamese-SpanishParallelCorpus-duy52000751
越南语-西班牙语平行语料数据集Vietnamese-SpanishParallelCorpus-duy52000751 数据来源:互联网公开数据 标签:机器翻译, 平行语料, 越南语, 西班牙语, 语言学, 自然语言处理, 语料库, 文本对齐 数据概述: 该数据集包含越南语和西班牙语的平行文本对,记录了两种语言的对应翻译示例。主要特征如下:...
-
多语言文本翻译对比数据集MultilingualTextTranslationComparison-shahules
多语言文本翻译对比数据集MultilingualTextTranslationComparison-shahules 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 多语言, 文本分析, 语言学, 文本比对, 英语, 西班牙语 数据概述:...
-
多语言翻译平行语料数据集MultilingualTranslationParallelCorpus-juanjosmorenogiraldo
多语言翻译平行语料数据集MultilingualTranslationParallelCorpus-juanjosmorenogiraldo 数据来源:互联网公开数据 标签:机器翻译, 语料库, 自然语言处理, 语言学, 翻译模型, 文本数据, 英语, 德语, 西班牙语 数据概述:...
-
UNIN大学毕业论文数据集UNINDatasetforGraduationThesis-dgomez216
UNIN大学毕业论文数据集UNINDatasetforGraduationThesis-dgomez216 数据来源:互联网公开数据 标签:毕业论文,学术研究,自然语言处理,文本分析,数据集,西班牙语,文本挖掘,学术资源 数据概述: 该数据集包含来自哥伦比亚 UNIN 大学(Universidad Internacional del...



