找到15个数据集

标签: 双语语料

过滤结果
  • nlp_text_sentence_Based_汉印尼复合句数据集

    2026年1月27日 30 145 130

    数据集概述 本数据集包含普通话与印尼语的复合句数据,核心内容围绕两种语言的复合句展开,为自然语言处理领域提供研究资源。数据集文件数量为1,无目录结构,主要文件格式为xlsx。 文件详解 文件名称:Data Set of Compound Sentences in Mandarin and Indonesian.xlsx 文件格式:XLSX...
    packageimg
  • EN_MNE_EN_THA_Authentic_human_translations_corpora_真实人类翻译语料库数据

    2025年12月27日 30 188 76

    数据集概述 本数据集包含EN-MNE、EN-THA两个真实人类翻译语料库,数据按研究方法选取并处理了长度在100-150字符的句子对,用于翻译相关研究。数据集仅含一个文件,无目录结构及训练测试、数据标签等拆分。 文件详解 文件名称:data.xlsx 文件格式:XLSX 字段映射介绍:包含EN-MNE、EN-...
    packageimg
  • CL_UVigoMED生物医药摘要双语语料库

    2025年11月27日 30 71 38

    数据集概述 该数据集是一个双语语料库,核心内容为从MEDLINE数据库提取的英文与西班牙文生物医药摘要。数据集包含两个文件,无目录结构,为自然语言处理(NLP)等相关领域的研究提供基础语料支持。 文件详解 文件名称: CL_UvigoMED_corpus_creation.png 文件格式: PNG (.png) 内容说明:...
    packageimg
  • 印尼语_米南加保语平行语料库

    2025年11月26日 30 128 1

    数据集概述 该数据集为印尼语与米南加保语的平行语料库,包含对应语言的句子对,覆盖日常语言使用的多场景与主题,支持机器学习在语言翻译领域的应用,助力自然语言处理研究与翻译应用开发。 文件详解 该数据集由1个CSV文件组成,具体说明如下: - 文件名称: Parallel Corpus Indonesian-Minang/original...
    packageimg
  • 爱尔兰语_英语平行语料库数据集

    2025年7月10日 30 190 95

    爱尔兰语_英语平行语料库数据集_Irish_English_Parallel_Corpus 数据来源:互联网公开数据 标签:机器翻译, 语言学, 平行语料库, 爱尔兰语, 英语, 自然语言处理, 文本翻译, 数据集构建 数据概述: 该数据集包含来自多个来源的爱尔兰语-英语平行语料,旨在促进爱尔兰语和英语之间的机器翻译研究与应用。主要特征如下:...
    packageimg
  • 柬埔寨新闻双语翻译数据集CambodiaNewsBilingualTranslationDataset-newmashedpotato

    2025年5月30日 30 153 72

    柬埔寨新闻双语翻译数据集CambodiaNewsBilingualTranslationDataset-newmashedpotato 数据来源:互联网公开数据 标签:机器翻译, 柬埔寨语, 英语, 双语语料, 新闻, 文本分析, 自然语言处理, 语言学 数据概述:...
    packageimg
  • 土耳其语与英语双语平行语料数据集Turkish-EnglishParallelCorpusDataset-eneskulak

    2025年5月29日 30 166 101

    土耳其语与英语双语平行语料数据集Turkish-EnglishParallelCorpusDataset-eneskulak 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,翻译研究,双语对齐,语言模型,计算机科学,数据挖掘 数据概述: 该数据集包含来自土耳其语和英语的双语平行文本数据,记录了两种语言之间的对应关系。主要特征如下:...
    packageimg
  • 印地语-英语平行语料库数据集Hindi-EnglishParallelCorpus-saumyamishra536

    2025年5月12日 30 28 10

    印地语-英语平行语料库数据集Hindi-EnglishParallelCorpus-saumyamishra536 数据来源:互联网公开数据 标签:机器翻译, 文本对齐, 语言模型, 印度语言, 语料库, 自然语言处理, 双语数据, 英语 数据概述: 该数据集包含来自互联网的印地语-...
    packageimg
  • 越南语-英语语义相似度分析数据集Vietnamese-EnglishSemanticSimilarityAnalysisDataset-dangthai

    2025年4月29日 30 50 20

    越南语-英语语义相似度分析数据集Vietnamese-EnglishSemanticSimilarityAnalysisDataset-dangthai 数据来源:互联网公开数据 标签:语义相似度, 越南语, 英语, 文本匹配, 自然语言处理, 机器翻译, 双语语料, 文本对 数据概述: 该数据集包含越南语-...
    packageimg
  • 英语与印地语混合语料数据集HinglishDataset-saahir2629

    2025年4月26日 30 72 68

    英语与印地语混合语料数据集HinglishDataset-saahir2629 数据来源:互联网公开数据 标签:语言研究,自然语言处理,数据集,双语语料,机器学习,语言模型,社会语言学,计算机科学 数据概述: 该数据集包含英语与印地语混合使用的文本数据,记录了在社交媒体,在线聊天和日常交流中广泛使用的Hinglish语言现象。主要特征如下:...
    packageimg
  • 法文与英文平行语料数据集French-EnglishParallelCorpusDataset-mayankkalbande9

    2025年4月24日 30 38 2

    法文与英文平行语料数据集French-EnglishParallelCorpusDataset-mayankkalbande9 数据来源:互联网公开数据 标签:语言翻译,平行语料,数据集,自然语言处理,机器学习,双语研究,文本分析,人工智能 数据概述: 该数据集包含法文与英文的平行语料,记录了两种语言之间的对应翻译文本。主要特征如下:...
    packageimg
  • 印地语-英语截断语料库数据集Hindi-EnglishTruncatedCorpusDataset-kalyanitewari

    2025年4月24日 30 65 32

    印地语-英语截断语料库数据集Hindi-EnglishTruncatedCorpusDataset-kalyanitewari 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,机器学习,双语语料,文本分析,计算机科学,多语言处理 数据概述:...
    packageimg
  • 中越双语平行语料数据集Chinese-VietnameseParallelCorpusDataset-flightstar

    2025年4月23日 30 155 117

    中越双语平行语料数据集Chinese-VietnameseParallelCorpusDataset-flightstar 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,翻译研究,双语资源,文本分析,语言技术,人工智能 数据概述: 该数据集包含来自中越双语平行语料库的数据,记录了中越两种语言的对应文本。主要特征如下:...
    packageimg
  • 越南语与德语平行语料数据集Vietnamese-GermanParallelCorpusDataset-flightstar

    2025年4月22日 30 121 11

    越南语与德语平行语料数据集Vietnamese-GermanParallelCorpusDataset-flightstar 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,语料库,双语数据,文本分析,人工智能,语言技术 数据概述: 该数据集包含越南语与德语的平行语料数据,记录了两种语言之间的对齐文本。主要特征如下:...
    packageimg
  • 乌尔都语与旁遮普语合并数据集

    2025年4月15日 30 8 3

    乌尔都语与旁遮普语合并数据集 数据来源:互联网公开数据 标签:乌尔都语,旁遮普语,双语数据集,词性标注,词形还原,语言处理 数据概述:...
    packageimg