找到16个数据集

标签: 语言数据

过滤结果
  • Glottolog数据库5_2_1_CLDFF格式数据集

    2025年12月15日 30 120 106

    数据集概述 该数据集为Glottolog数据库5.2.1版本的CLDF格式归档文件,包含语言研究相关数据,由Max Planck Institute for Evolutionary Anthropology发布,可通过指定链接获取。 文件详解 文件名称: glottolog-cldf-v5.2.1.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 形态句法区分的不确定性与变异性测量评估补充材料

    2025年12月15日 30 11 10

    数据集概述 本数据集是《语言类型学》期刊相关论文的补充材料,围绕形态句法区分的三个核心问题(边界强度、构成、架构),提供研究使用的原始数据及统计分析(相关矩阵、随机森林、聚类验证)的代码与结果文档,支撑方法论问题的探讨。 文件详解...
    packageimg
  • 语言数据资源链接数据库

    2025年12月10日 30 180 86

    数据集概述 该数据集是一个链接资源数据库,汇集了多个语言学数据库与数据集的访问链接,旨在帮助用户查找符合研究需求的免费语言类网络数据资源。此为最终版本,将不再维护或更新。 文件详解 文件名称:linguistic-data-master.zip 文件格式:ZIP(.zip)...
    packageimg
  • 巴灵骨骼论文补充材料_美拉尼西亚语言与词汇语义关联研究

    2025年12月9日 30 7 2

    数据集概述 本数据集为论文《Baring the bones: the lexico-semantic association of bone with strength in Melanesia and the study of colexification》的补充材料,包含两个附录,聚焦美拉尼西亚语言中“骨骼”与“力量”的词汇语义关联及共现研究。...
    packageimg
  • 恩德贝莱语祖鲁语斯瓦蒂语聪加语科萨语情态可能性数据集2024

    2025年12月8日 30 29 11

    数据集概述 本数据集聚焦恩德贝莱语、祖鲁语、斯瓦蒂语、聪加语、科萨语五种语言的情态可能性研究,包含相关语言数据及附录文档,为非洲语言情态语法分析提供支持。 文件详解 Crane et al 2024 Modal Possibility Appendix B Dataset.pdf:PDF格式文档,可能包含数据集的背景说明、研究方法或补充信息 Crane...
    packageimg
  • D_PLACE项目数据库_地点语言文化与环境数据v2_2_1

    2025年12月7日 30 39 8

    数据集概述 该数据集是D-PLACE项目(地点、语言、文化与环境数据库)的数据仓库,包含与全球各地人类社会相关的地点、语言、文化实践及环境背景的综合数据,为跨学科研究提供基础资料。 文件详解 该数据集包含一个压缩文件,具体说明如下: - 文件名称: dplace-data-v2.2.1.zip - 文件格式: ZIP压缩包(.zip) - 内容说明:...
    packageimg
  • 信德语文章数据集

    2025年4月27日 30 11 6

    信德语文章数据集 数据来源:互联网公开数据 标签:信德语,自然语言处理,NLP,文本分析,聚类,时间序列,语言数据,文章数据 数据概述:...
    packageimg
  • 达里贾语开放数据集DarijaOpenDataset-youneselbouknify

    2025年4月25日 30 72 33

    达里贾语开放数据集DarijaOpenDataset-youneselbouknify 数据来源:互联网公开数据 标签:达里贾语,语言数据,自然语言处理,数据集,语料库,人工智能,机器学习,语言学 数据概述:该数据集包含来自不同来源的达里贾语(摩洛哥阿拉伯语方言)文本数据,记录了日常对话,新闻报道,社交媒体帖子等多种类型的文本内容。主要特征如下:...
    packageimg
  • 俄罗斯越南语言数据集RussianVietnameseDataset-flightstar

    2025年4月25日 30 36 8

    俄罗斯越南语言数据集RussianVietnameseDataset-flightstar 数据来源:互联网公开数据 标签:语言学,自然语言处理,数据集,机器翻译,跨语言分析,人工智能,语言研究,文本分析 数据概述: 该数据集包含来自互联网公开资源的俄语和越南语语言数据,记录了两种语言的文本句子对,适用于机器翻译,语言学研究等任务。主要特征如下:...
    packageimg
  • 英语到泰卢固语句子翻译数据集EnglishtoTeluguSentencesTranslationDataset-krizzna69

    2025年4月23日 30 199 189

    英语到泰卢固语句子翻译数据集EnglishtoTeluguSentencesTranslationDataset-krizzna69 数据来源:互联网公开数据 标签:机器翻译,语言数据,数据集,泰卢固语,英语,自然语言处理,翻译研究,多语言处理 数据概述: 该数据集包含英语到泰卢固语的句子翻译对,记录了大量的双语句子对照数据。主要特征如下:...
    packageimg
  • 英印机器翻译练习数据集-arunmohan003

    2025年4月22日 30 181 171

    英印机器翻译练习数据集-arunmohan003 数据来源:互联网公开数据 标签:机器翻译,英印翻译,语言数据,练习数据,自然语言处理,NLP,样本数据 数据概述:...
    packageimg
  • 乌尔都语句子数据集-2023年-sheerazhussain

    2025年4月21日 30 73 68

    乌尔都语句子数据集-2023年-sheerazhussain 数据来源:互联网公开数据 标签:乌尔都语,句子,语言学,文本分析,自然语言处理,语言数据 数据概述: 本数据集包含一小部分乌尔都语句子,适合用于语言学研究、文本分析和自然语言处理任务。数据集中的句子涵盖了乌尔都语的多种语言特征和语法结构,为研究人员提供了基础的语言数据资源。 数据用途概述:...
    packageimg
  • 英语-伊博语圣经数据集

    2025年4月17日 30 191 37

    英语-伊博语圣经数据集 数据来源:互联网公开数据 标签:机器翻译,伊博语,圣经文本,英语,语言数据,语料库,宗教文本 数据概述: 本数据集为英语和伊博语的圣经文本对齐数据,主要用于英语至伊博语的机器翻译研究。数据来源于Jehovah...
    packageimg
  • 英译马拉提语数据集

    2025年4月15日 30 99 30

    英译马拉提语数据集 数据来源:互联网公开数据 标签:英译马拉提,自然语言处理,神经机器翻译,序列到序列,语言数据,翻译技术 数据概述: 本数据集专注于印度语言马拉提语的翻译任务。数据通过网络抓取技术收集,涵盖常用句子和词汇,旨在为英译马拉提语的研究和应用提供基础数据支持。 数据用途概述:...
    packageimg
  • 欧盟医疗健康领域多语言平行语料库数据集英语-葡萄牙语

    2025年4月14日 30 47 3

    欧盟医疗健康领域多语言平行语料库数据集英语-葡萄牙语 数据来源:互联网公开数据 标签:机器翻译,医疗健康,平行语料库,英语,葡萄牙语,自然语言处理,欧盟,ELRC-Medical-V2,语言数据 数据概述: ELRC-...
    packageimg
  • 孟加拉语对话摘要数据集英文翻译

    2025年4月14日 30 96 16

    孟加拉语对话摘要数据集英文翻译 数据来源:互联网公开数据 标签:对话摘要, 孟加拉语, 自然语言处理, 机器翻译, 文本摘要, 语言数据, 翻译数据集 数据概述:...
    packageimg