找到74个数据集

标签: 跨语言研究

过滤结果
  • arabic_vfq_2_Based视力相关生活质量评分数据

    2026年2月9日 30 159 157

    数据集概述 本数据集包含arabic vfq 2相关的评分数据,共1个文件,文件格式为.xlsx,无目录结构,未划分训练/测试集、数据/标签集及原始/处理数据,无自述文件或内容预览。 文件详解 文件名称:arabic vfq 2 (scores).xlsx 文件格式:XLSX 字段映射介绍:未提供具体字段信息,推测包含与arabic vfq...
    packageimg
  • SherlockBox_RuNeg_Based_俄语否定标注数据

    2026年1月28日 30 137 133

    数据集概述 本数据集为俄语否定标注数据集,包含阿瑟·柯南·道尔《硬纸盒子》俄语译文的120个含否定句,标注了否定触发词和否定范围。数据由母语者用Prodigy工具标注,以JSON和TXT两种格式呈现,用于自然语言处理中否定分析研究。 文件详解 文件1:RUS.json 文件格式:JSON...
    packageimg
  • WMT16_Based_Scielo生物医学翻译任务单语数据集

    2026年2月8日 30 48 31

    数据集概述 本数据集为第一届机器翻译会议(WMT'16)生物医学翻译任务提供的Scielo单语数据,包含英语、西班牙语、葡萄牙语、法语4种语言的生物医学相关文本,源自Scielo数据库,共7个XML文件,无目录层级划分。 文件详解 英文生物医学文件 文件名称:en-health.xml、en-biological.xml 文件格式:XML...
    packageimg
  • 医疗教育_健康声明循证实践教学研究补充数据

    2026年2月2日 30 186 149

    数据集概述 本数据集为“使用健康声明向医疗专业学生教授循证实践的混合方法研究”的补充材料,包含挪威数据集的英文翻译文件及研究相关清单。总计7个文件,涵盖定量数据、开放问题、焦点小组访谈的翻译内容,以及研究报告规范清单,支持医疗教育研究的验证与复现。 文件详解 数据文件 文件名称:2_All quantitative data_English...
    packageimg
  • Extended_感官分析问卷_食品研究数据

    2026年2月1日 30 149 97

    数据集概述 本数据集包含针对市售煎饼预混料和扁豆基煎饼预混料的感官分析问卷,提供英文和原始葡萄牙语两个版本,用于食品感官评估研究,仅包含1个文件。 文件详解 文件名称:data Extended.docx 文件格式:DOCX 字段映射介绍:包含食品感官分析问卷内容,涵盖市售煎饼预混料和扁豆基煎饼预混料的感官评估维度,提供英文和葡萄牙语双语版本。...
    packageimg
  • Reevisi_AI_AI在外语学习中的使用数据

    2026年1月31日 30 63 3

    数据集概述 本数据集聚焦于AI在外语学习中的使用情况,包含一份结构化表格文件,为研究AI技术在外语教育场景中的应用提供数据支持。 文件详解 文件名称:Reevisi Data penggunaan AI dalam pembelajaran bahasa asing (Mandarin).xlsx 文件格式:XLSX...
    packageimg
  • UNIC_Based语料库对齐文件模板数据v1_1

    2026年1月31日 30 82 2

    数据集概述 本数据集为UNIC平台的语料库对齐文件模板,包含JSON模板和Excel模板,支持用户按模板结构化语料库对齐文件,可通过转换工具将Excel文件转为JSON压缩包上传至UNIC平台,共包含2个文件。 文件详解 UNIC_Alignment template.json 文件格式:JSON...
    packageimg
  • AfBo_Based_词缀借用全球调查数据集2013

    2026年1月31日 30 119 102

    数据集概述 本数据集为2013年发布的AfBo全球词缀借用调查数据,由Frank Seifart完成,记录了全球范围内语言词缀借用现象的调查内容,可通过指定在线链接获取,包含1个压缩文件。 文件详解 文件名称:waab-v2013.zip 文件格式:ZIP(压缩文件) 字段映射介绍:未提供具体字段信息,文件为压缩包格式,内部内容需解压后查看 数据来源...
    packageimg
  • Pre_Islamic_Hejaz_阿拉伯女性婚姻制度研究文献集

    2026年1月28日 30 5 4

    数据集概述 本数据集围绕希贾兹地区前伊斯兰时期阿拉伯女性婚姻主题,收录4份文档资料,涵盖英文研究论文与阿拉伯语文献,涉及部落文化、女性婚姻自主权等内容,为研究该时期女性婚姻状况提供多语言参考资料。 文件详解 文件名称:papers.docx 文件格式:DOCX 字段映射介绍:英文研究文档,主题为希贾兹地区前伊斯兰时期阿拉伯女性婚姻相关研究内容...
    packageimg
  • paradiplomacy_Based_国际关系次国家外交文献综述数据库

    2026年1月21日 30 142 54

    数据集概述 本数据集为paradiplomacy主题的文献综述数据库,包含超过一千五百份学术出版物,涵盖文章、章节及书籍等类型,涉及二十余种语言,是研究次国家外交领域的文献资源集合。 文件详解 文件名称:Baza danych publikacji paradyplomacja_25 stycznia.xlsx 文件格式:XLSX...
    packageimg
  • 网络攻击角色扮演标注数据_基于法语私人即时通讯平台的大型用户群组_v3_1

    2026年1月21日 30 163 131

    数据集概述 本数据集为CyberAgressionAdo-Large,包含通过角色扮演游戏收集的法语网络攻击场景标注数据,模拟私人即时通讯平台可能发生的网络攻击情况,是CyberAgressionAdo-v2的扩展版本,共含36个文件。 文件详解 标注场景文件 文件名称:包含如scenario_homophobia_julie_fourth (Re-...
    packageimg
  • Thucydides_Persian_修昔底德著作波斯语译本关键术语对应数据

    2026年1月20日 30 48 6

    数据集概述 本数据集系统整理了修昔底德《伯罗奔尼撒战争史》波斯语译本中“Barbarians”“Persians”“Medes”三类关键术语的对应翻译。通过提取希腊原文术语(如βάρβαρος、Μῆδος等),匹配穆罕默德·哈桑·洛特菲译本中的波斯语表达,包含原文出处、波斯语译文及英文回译等信息,共9个结构化文件,支持古典文献翻译研究与术语对比分析。...
    packageimg
  • Turkish_Lexicon_Emotions_MaxQDA词典功能专用数据

    2026年1月19日 30 96 9

    数据集概述 本数据集为专为MaxQDA软件词典功能制备的土耳其语情感词汇词典,包含恐惧、悲伤、愤怒、失望、快乐五类情感词汇,由欧盟Horizon 2020研究与创新计划资助项目产出,共5个文件。 文件详解 恐惧情感词汇文件 文件名称:FEAR.xlsx 文件格式:XLSX 字段映射介绍:包含与“恐惧”情感相关的土耳其语词汇集合 悲伤情感词汇文件...
    packageimg
  • DIPROMATS_2024_Shared_Task_2_叙事识别小样本训练数据

    2026年1月19日 30 160 41

    数据集概述 本数据集是DIPROMATS 2024共享任务2的小样本训练数据,用于叙事识别任务。叙事是指有因果联系的事件序列,在国际关系领域,国际行为体通过战略叙事构建国际政治的过去、现在和未来的共同意义。数据集包含英文和西班牙文两种语言的训练数据,共2个文件。 文件详解 文件名称:dipromats24_t2_train_en_ids.json...
    packageimg
  • LLM_Portuguese_Based_医疗领域葡萄牙语大语言模型系统综述分析数据

    2026年1月18日 30 103 63

    数据集概述 本数据集源自系统综述“Large Language Models in Portuguese for Healthcare”,包含综述分析的文章列表、各阶段纳入排除标准及分析提取的数据,共2个文件,支持医疗领域葡萄牙语大语言模型相关研究的分析与整合。 文件详解 SLR_data_extraction_LLM.xlsx 文件格式:XLSX...
    packageimg
  • Navzájem_vzájemně_and_spolu_Based_捷克语互惠标记词分类研究数据

    2026年1月11日 30 138 111

    数据集概述 本数据集围绕捷克语中"navzájem/vzájemně"和"spolu"作为互惠标记词的用法展开,包含4个文件,按标记词的基本与非基本属性分类,用于语言学领域对捷克语互惠标记词的语法功能研究。 文件详解 数据文件组(共4个.xlsx文件) 文件名称:navzájem-vzájemně as a non-basic marker.xlsx...
    packageimg
  • Multi_CAST_Nafsan_Based多语言口语文本标注语料库数据2311

    2026年1月15日 30 46 25

    数据集概述 本数据集为Multi-CAST多语言口语文本标注语料库的一部分,具体包含Nafsan语言的口语文本标注数据。该语料库由班贝格大学发布,属于Multi-CAST项目的2311版本,是多语言口语文本资源的重要组成部分。 文件详解 压缩文件 文件名称:mcnafsan-v2311.zip 文件格式:ZIP 字段映射介绍:压缩包内包含Multi-...
    packageimg
  • PES_French_translation_Based_物理努力量表法语翻译数据与代码

    2026年1月13日 30 14 9

    数据集概述 本数据集包含物理努力量表(Physical effort scale)法语翻译相关的数据与代码,共2个文件,无目录结构。数据用于支持该量表的法语版本应用,包含样本文件和代码文件,适用于相关实验场景的样本分析。 文件详解 文件名称:pes_french_effort_scale_sample2.Rmd 文件格式:.rmd 字段映射介绍:R...
    packageimg
  • Archaeology_Vocabulary_DEU_ENG_考古学德英双语术语对照数据

    2026年1月13日 30 25 12

    数据集概述 本数据集为德英双语考古学词汇表,涵盖田野考古、建筑、陶器、方法、防御工事等主题。词汇经学术翻译场景验证,部分含参考文献,部分无直接对应译文。原始术语库整合自SDL Multiterm 2015及2017版本,经OpenRefine 3.1清洗,包含5个文件。 文件详解 考古学词汇表文件(Excel格式)...
    packageimg
  • Latin_American_Source_替代认识论与负责任研究评估学术产出内容分析数据集

    2026年1月12日 30 26 24

    数据集概述 本数据集整合2019-2024年拉丁美洲关于替代认识论与负责任研究评估的学术产出,包含两份核心表格:第一份系统整理52篇文献的书目信息、主题、理论方法等内容;第二份为66个关键术语的西、葡、英三语操作术语表,旨在支持主题模式识别、知识缺口分析及跨语言研究。 文件详解...
    packageimg