-
Sentiment_Analysis_Based西班牙推文情感分析与哥伦比亚2014选举应用数据集
2026年1月7日 30 151 68
数据集概述 本数据集为论文配套数据,包含用于西班牙推文情感分析系统开发及哥伦比亚2014年总统选举应用的相关数据,支持情感分析模型构建与选举相关文本情感研究。 文件详解 文件名称:sentiment-analysis-and-voting-inference-v1.0.zip 文件格式:ZIP...
-
AMOR_Corpus_Spanish_Morality_Corpus_西班牙语在线评论道德标注数据集
2026年1月3日 30 31 0
数据集概述 本数据集是AMOR项目产出的首个可发布版本西班牙语在线评论道德基础标注语料库,包含从西班牙语Reddit社区提取并经人工筛选的评论,由训练后的标注者通过Qualtrics平台完成标注。数据涵盖标注文本及标注者档案两部分,适用于计算语言学和社会科学领域关于西班牙语在线话语中道德语言与价值表达的研究。 文件详解 语料库文件(Corpus...
-
PharmaCoNER药物物质化合物蛋白质命名实体识别西班牙语临床案例报告语料库
2025年12月23日 30 22 10
数据集概述 该数据集是PharmaCoNER共享任务的人工标注黄金标准语料库,包含1000篇西班牙语临床案例报告,覆盖肿瘤学、泌尿学等多个医学领域,标注了药物物质、化合物、蛋白质等实体,适用于生物医学命名实体识别研究。 文件详解 文件名称: pharmaconer.zip 文件格式: ZIP压缩文件 内容说明:...
-
西班牙卡斯特利翁小学二年级学生学业成绩数据集2011_2012
2025年12月22日 30 44 6
数据集概述 本数据集记录了2011-2012学年春季,西班牙卡斯特利翁四所公立学校小学二年级学生的期末学业成绩。评估涵盖数学、西班牙语等七个学科领域,成绩采用1至5分的评分量表,为分析该群体学业表现提供量化数据支持。 文件详解 数据文件: GRADES_Data_IC_T2-Post.dat: 数据文件,格式为.dat...
-
PAN18跨域作者身份识别数据集
2025年12月22日 30 89 85
数据集概述 该数据集提供跨域作者身份识别问题的语料库,覆盖英语、法语、意大利语、波兰语、西班牙语5种语言,包含已知候选作者同人小说与未知同人小说,通过JSON文件标注问题信息、真实作者及集合信息。 文件详解 文件名称: pan18-cross-domain-authorship-attribution-dataset.zip 文件格式: ZIP压缩包...
-
数据可视化焦点小组分析数据集
2025年12月21日 30 156 2
数据集概述 该数据集包含两组关于数据可视化的焦点小组分析资料,涵盖原始转录文本及分析矩阵文件,为研究数据可视化相关讨论提供结构化数据支持。 文件详解 分析矩阵文件: frequency_matrix_v2.xlsx:Excel格式文件,包含焦点小组内容的频率分析矩阵,横轴标注分类体系(元类别、类别、子类别),通过颜色区分层级,支持后续轴心编码。...
-
经颅随机噪声刺激对多语言年轻成人音位语言流畅性的增强效应数据集
2025年12月20日 30 156 24
数据集概述 本数据集基于一项探究经颅随机噪声刺激(tRNS)对健康多语言成人语言流畅性影响的研究,包含实验设计、方法、结果及结论等内容,聚焦tRNS对音位语言流畅性的增强效应分析。 文件详解 文件名称: Balboa-Bandeira_2024_verbal fluency.pdf 文件格式: PDF (.pdf) 文件内容:...
-
马略卡岛多语言语言景观数据集2023
2025年12月20日 30 179 20
数据集概述 该数据集包含2023年5月在马略卡岛实地考察中收集的语言景观照片,覆盖帕尔马、波连萨港、瓦尔德莫萨和阿尔库迪亚四个地点,重点记录罗马尼亚语、加泰罗尼亚语与西班牙语的互动,同时包含符号元素、旅游语言及越界标识等内容。 文件详解 核心文件:均为.jpg格式的语言景观照片,共一百个文件,无子目录结构。...
-
西班牙语方言基准数据集
2025年12月19日 30 51 41
数据集概述 本数据集聚焦西班牙语方言差异,通过31道选择题评估大型语言模型(LLMs)对不同西班牙语方言的区分与使用能力,旨在解决传统基准忽略方言细微差别的问题,为分析模型方言偏见提供支持。 文件详解 文件名称: example_of_results.zip:压缩文件,可能包含数据集结果示例或相关说明文档 文件名称:...
-
CodiEsp西班牙语临床病例ICD10编码金标准数据集_CLEF2020
2025年12月19日 30 18 12
数据集概述 该数据集是CLEF eHealth 2020 CodiEsp赛道的西班牙语临床病例金标准语料库,包含训练集、开发集、测试集(含人工注释)及未标注背景集,共一千个临床病例,采用CIE10(西班牙版ICD10)编码术语,为非英语临床病例自动编码研究提供标注数据。 文件详解 数据集为zip压缩包,包含四个文件夹,具体如下: -...
-
Tolstoi_Leon_El_cupon_falso_Based_伪造票据主题文学文档完整数据
2025年12月19日 30 170 97
数据集概述 本数据集包含一篇PDF格式的文档,文档标题为"El cupon falso",作者为Tolstoi Leon,未提供具体内容描述。 文件详解 文件名称: El_cupon_falso-Tolstoi_Leon.pdf 文件格式: PDF (.pdf) 内容说明: 单篇文档文件,未提供具体内容字段信息。 适用场景 文学研究:...
-
教育西班牙语问答数据集_ESQAD
2025年12月19日 30 58 52
数据集概述 本数据集为西班牙语教育场景下的问答生成(QAG)任务构建,包含与西班牙大学入学考试(EVAU)课程对齐的人工标注数据、文学及法律领域自动生成数据,以及经师生验证的试点研究子集,支持多场景QAG模型开发与评估。 文件详解 该数据集包含四类结构化数据文件,具体说明如下: - EVAU课程对齐数据 -...
-
西班牙语医学语义索引开发数据集
2025年12月18日 30 188 43
数据集概述 该数据集为西班牙语医学语义索引(MESINESP)开发集,含七百五十条经人工标注的医学文献记录,标注使用DeCS编码(西班牙语版MeSH术语),每条记录至少由两名索引员标注并达成共识,可用于医学语义索引相关研究。 文件详解 压缩文件: mesinesp-development-set.zip,格式为ZIP,包含两个开发子集 官方开发集:...
-
伊比利亚文学文本跨文化探索研究语料库
2025年12月13日 30 182 7
数据集概述 本数据集是一个文学语料库,作为博士论文《文学文本的跨文化阅读:西班牙语作为外语大学课堂中伊比利亚关系的表征》的组成部分,聚焦于从跨文化视角研究伊比利亚文学文本。 文件详解 文件名称: Corpus literario para la investigación sobre las relaciones entre los textos...
-
MEDDOCAN西班牙语临床病例报告匿名化标注数据集
2025年12月16日 30 12 4
数据集概述 该数据集包含MEDDOCAN共享任务的训练、开发、测试集(含黄金标准标注)及背景集(无标注),用于西班牙语临床病例报告的文档匿名化研究。标注采用Brat和XML格式,支持格式转换,为医学文本去标识任务提供标准化数据。 文件详解 文件名称: meddocan.zip 文件格式: ZIP压缩包 内容说明:...
-
师生关系儿童评定数据集2015_2016
2025年12月16日 30 179 74
数据集概述 该数据集包含西班牙卡斯特利翁公立学校小学六年级学生对师生关系儿童评定量表22个题项的回答,数据采集于2015-2016学年春季,包含温暖、冲突、亲密三个因子的计算结果,量表由Wu等人(2010)开发、García Bacete等人(2014)译为西班牙语。 文件详解 TEACHER-STUDENT-...
-
父母教养方式问卷数据集2013_2014
2025年12月16日 30 20 19
数据集概述 该数据集包含西班牙卡斯特利翁公立学校四年级学生父母对父母教养方式问卷(Robinson等,1995)62个条目的回答,问卷经García Bacete等(2014)译为西班牙语。数据收集于2013-2014学年春季,父母分别作答,包含权威、专制、放任三类教养策略及对应维度的计算结果。 文件详解 文件名称:PARENTING_Met-...
-
西班牙卡斯特利翁地区小学六年级学生学业成绩评估数据集2015_2016
2025年12月15日 30 87 7
数据集概述 本数据集记录了2015-2016学年春季西班牙卡斯特利翁地区四所公立学校小学六年级学生的学业成绩评估结果,涵盖数学、西班牙语、瓦伦西亚语等八个学科领域,成绩采用1至5分的评分标准,为分析该群体学业表现提供数据支持。 文件详解 文档类文件(PDF格式): GRADES_Met-...
-
iRead4Skills_数据集2_多语言标注语料库报告
2025年12月15日 30 17 6
数据集概述 本数据集是iRead4Skills项目的第二部分,提供了针对法语、葡萄牙语和西班牙语的复杂度分级标注语料库的详细报告,包含分类标注流程、数据构成、质量分析及标注样本等核心内容。 文件详解 文件名称: iRead4Skills_D3.7_Dataset_Annotated_Corpora_Report.pdf 文件格式: PDF (.pdf)...
-
西班牙语在欧洲的动态_回流_双语现象与新语域问卷
2025年12月15日 30 77 29
数据集概述 本数据集为一份关于西班牙语在欧洲动态的问卷,核心围绕西班牙语回流现象、双语使用情况及新语域特征展开,通过结构化问卷形式收集相关信息,为研究欧洲西班牙语的语言变化提供基础数据支持。 文件详解 文件名称: Cuestionario.pdf 文件格式: PDF (.pdf) 文件内容:...



