找到81个数据集

标签: 法语

过滤结果
  • Benchmark_Database_语音对齐手动编辑基准数据

    2026年2月8日 30 42 7

    数据集概述 本数据集为语音对齐基准数据库,包含十五个压缩文件,涵盖斯拉夫语、法语、罗曼语等多种语言的手动编辑语音对齐数据,旨在为历史语言学和方言学领域的自动对齐算法提供测试与性能优化的基准平台,覆盖语音对齐分析中的典型问题。 文件详解 压缩文件组(archive_files)...
    packageimg
  • WMT16_Based_Scielo生物医学翻译任务单语数据集

    2026年2月8日 30 122 44

    数据集概述 本数据集为第一届机器翻译会议(WMT'16)生物医学翻译任务提供的Scielo单语数据,包含英语、西班牙语、葡萄牙语、法语4种语言的生物医学相关文本,源自Scielo数据库,共7个XML文件,无目录层级划分。 文件详解 英文生物医学文件 文件名称:en-health.xml、en-biological.xml 文件格式:XML...
    packageimg
  • PB2007_Based_法语声学_发音同步语音数据集

    2026年1月31日 30 165 108

    数据集概述 本数据集为PB2007法语声学-发音语音数据库,包含法语语音的声学信号与电磁发音仪(EMA)记录的发音运动数据,同步采集自法语受试者,支持语音生产机制研究与声学-发音转换模型开发。 文件详解 _seq/目录 内容:电磁发音仪(EMA)数据,采样频率100Hz...
    packageimg
  • AI4D_Based法语至丰贝埃维神经机器翻译平行文本数据集

    2026年1月29日 30 143 87

    数据集概述 本数据集是面向神经机器翻译任务的多语言平行文本集合,包含从法语到丰贝语(多哥语言)、法语到埃维语(贝宁语言)的平行句子对,总计七万余条标注数据,适用于机器翻译和句子分类任务,由AI4D倡议贡献。 文件详解 文件名称:French_to_fongbe.csv 文件格式:CSV...
    packageimg
  • EASIN_GBIF_Based_比利时外来陆生软体动物登记清单数据

    2026年1月25日 30 39 38

    数据集概述 本数据集是比利时外来陆生软体动物登记清单,由比利时皇家自然科学研究所的Thierry Backeljau维护,包含1800年以来比利时野外发现的29种非本地陆生软体动物信息,基于文献调查和RBINS内部信息编制,可用于外来软体动物研究与管理或区域/国家外来物种登记编制。 文件详解 alien_mollusca_checklist.xlsx...
    packageimg
  • Giravolt_Project_古罗马玻璃香水瓶多语言描述与三维模型数据

    2026年1月21日 30 51 9

    数据集概述 本数据集包含古罗马2世纪圆柱形玻璃香水瓶(FLASCÓ DE VIDRE)的多语言描述与数字化文件,由Giravolt项目创建。文物特征为直颈、钟形无唇边口沿,用于盛放药膏或香水,主体有两个面,尺寸11.2×2.7×2.5厘米。数据集含6个文件,支持文物数字化研究与展示。 文件详解 三维模型文件...
    packageimg
  • Decesare_Based_堕胎立场实验研究_GPT模型生成预设分句数据

    2026年1月21日 30 24 12

    数据集概述 本数据集为论文“Pro-life, neutral or pro-choice? An experimental study on informative presupposition clefts generated by GPT-3.5 and GPT-4o in Italian, French and...
    packageimg
  • French_WSD_Based_Princeton_WordNet标识符法语词义消歧数据集

    2026年1月17日 30 113 26

    数据集概述 本数据集用于基于Princeton WordNet标识符的法语词义消歧任务,包含两个自动翻译并对齐的训练语料库(SemCor、WordNet Gloss Corpus),以及一个从SemEval 2013任务12转换而来的测试语料库,总计3个XML文件。 文件详解 训练语料库文件...
    packageimg
  • Attinger_Based_苏美尔语_法语文学文本词典JSON解析数据_Version_0_1

    2026年1月11日 30 49 8

    数据集概述 本数据集是对Attinger, P.(2021)所著《苏美尔语-法语词典:主要基于古巴比伦文学文本》的InDesign版本进行解析后得到的JSON树结构数据,版本为0.1,包含1个文件,用于苏美尔语与法语的词汇对照及文学文本研究。 文件详解 文件名称:attinger.json 文件格式:JSON...
    packageimg
  • FID_Prominent_Anchor_Time_French自由间接引语事件时间锚定实验数据集

    2026年1月7日 30 202 196

    数据集概述 本数据集为法语自由间接引语(FID)事件时间锚定的强制选择实验数据,包含实验的人口统计信息、所有被试反应、刺激材料顺序及刺激随机化文档,共4个文件,验证了前期语料库研究的发现。 文件详解 数据文件(.xlsx格式,共2个) FIDPromAnchor_DATA_demographic_info.xlsx:包含实验被试的人口统计信息...
    packageimg
  • European_Parliament_Based_欧洲议会全会演讲语料库列表及多语言搭配示例数据

    2026年1月7日 30 29 23

    数据集概述 本数据集包含2014年11月至2018年4月期间欧洲议会全会演讲语料库的演讲来源辩论列表、演讲者姓名,以及英语、法语、德语、匈牙利语中与“refugee(s)”“refugié(s)”“Flüchtling(e)”“menekült(ek)”搭配的动词示例,所有内容由论文作者识别整理。 文件详解 文件名称:List of debates...
    packageimg
  • Multilingual_Dynamics_Based_中世纪佛兰德斯多语言文学手稿元数据_2024版

    2026年1月2日 30 171 105

    数据集概述 本数据集是“中世纪佛兰德斯多语言文学动态”项目的一部分,包含2539份现存中世纪佛兰德斯手稿(约1200-1500年)的元数据,涵盖荷兰语、法语和拉丁语文学文本,涉及手稿的基本信息、文本特征、来源、抄本学、装饰和书写体等6类主题,为研究该地区多语言文学文化的生产与接受提供基础数据。 文件详解 文件名称:Dataset...
    packageimg
  • Survey_Questions_Self_Assessment_瑞士50_人群数字技能多语言自评问卷数据

    2025年12月31日 30 197 157

    数据集概述 本数据集包含用于瑞士50岁以上人群数字技能自评的问卷,涵盖德语、法语和意大利语三种语言版本。数据旨在评估该群体的数字技能水平,总计包含三份文件。 文件详解 文件名称:Webseite & Word_ALLE Fragen_Französisch.xlsx 文件格式:XLSX...
    packageimg
  • PAN18跨域作者身份识别数据集

    2025年12月22日 30 209 85

    数据集概述 该数据集提供跨域作者身份识别问题的语料库,覆盖英语、法语、意大利语、波兰语、西班牙语5种语言,包含已知候选作者同人小说与未知同人小说,通过JSON文件标注问题信息、真实作者及集合信息。 文件详解 文件名称: pan18-cross-domain-authorship-attribution-dataset.zip 文件格式: ZIP压缩包...
    packageimg
  • 刚果共和国地理与语言数据集

    2025年12月20日 30 151 71

    数据集概述 该数据集包含刚果共和国的地理与语言相关数据,涉及国家位置、邻国信息及官方语言等内容,同时提供相关的图片和3D模型文件,为了解刚果共和国基础信息提供支持。 文件详解...
    packageimg
  • 法语与乌兹别克语名词性属原则研究_PDF文档

    2025年12月19日 30 178 83

    数据集概述 该数据集包含一份关于法语与乌兹别克语名词性属原则研究的PDF文档,聚焦两种语言中名词性属相关的语言学分析内容,为比较语言学研究提供资料支持。 文件详解 文件名称: Анарбоева Ирода Ориповна.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 名词性短语的交际语用层面_以法语和乌兹别克语为例

    2025年12月19日 30 106 75

    数据集概述 本数据集聚焦名词性短语的交际语用层面研究,以法语和乌兹别克语为具体案例,通过单篇PDF文档呈现相关分析内容,为语言对比研究提供基础资料。 文件详解 文件名称:Anarboyeva Irodaxon Oripovna.pdf 文件格式:PDF(.pdf)...
    packageimg
  • 开罗Bashtil地区Mona的双耳录音描述与评论的阿拉伯语及法语转录文本2011

    2025年12月18日 30 30 25

    数据集概述 该数据集包含2011年10月26日在埃及开罗Bashtil地区收集的双耳录音相关转录文本,是“Mics in the Ears”双耳实验的一部分,记录了参与者Mona对自身录制的城市声音路线的描述与评论,包含原始阿拉伯语及法语翻译版本。 文件详解 文件名称: Arabic transcript of description and...
    packageimg
  • 法语作为教学语言的语言实践组织文档

    2025年12月18日 30 116 103

    数据集概述 本数据集为一份PDF文档,内容是法语作为教学语言的语言实践组织要素,用于构建PEAPL项目和COMPER项目的框架,支撑相关教育与语言研究工作。 文件详解 文件名称: Domaine du français langue de scolarisation.pdf 文件格式: PDF 内容说明:...
    packageimg
  • 瑞士调解语料库

    2025年12月18日 30 188 61

    数据集概述 本数据集为瑞士调解语料库,包含由瑞士认证专业调解员主持的十二组角色扮演调解会话转录数据,涉及意大利语和法语。数据由瑞士意大利语大学IALS研究所于2017-2023年收集,用于论证研究与语言学领域的学术分析。 文件详解 文件名称: Swiss Mediation Corpus data.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg