找到642个数据集

标签: 机器翻译

过滤结果
  • 英语-乌尔都语翻译数据集English-UrduTranslationDataset-cygnusanubis

    2025年4月29日   

    英语-乌尔都语翻译数据集English-UrduTranslationDataset-cygnusanubis 数据来源:互联网公开数据 标签:机器翻译, 语言模型, 文本翻译, 英语, 乌尔都语, 自然语言处理, 双语对照, 语料库 数据概述: 该数据集包含英语和乌尔都语的翻译对,记录了英语句子及其对应的乌尔都语翻译。主要特征如下:...
    packageimg
  • 新闻摘要生成验证数据集NewsSummarizationValidationDataset-osamamahmoud14

    2025年4月29日   

    新闻摘要生成验证数据集NewsSummarizationValidationDataset-osamamahmoud14 数据来源:互联网公开数据 标签:新闻摘要, 自然语言处理, 文本生成, 机器翻译, 文本摘要, 验证数据集, 深度学习, 语料库 数据概述:...
    packageimg
  • 印地语-英语翻译数据集Hindi-EnglishTranslationDataset-praskr

    2025年4月29日   

    印地语-英语翻译数据集Hindi-EnglishTranslationDataset-praskr 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 印地语, 英语, 语言学, 自然语言处理, 双语语料库, 文本对齐 数据概述: 该数据集包含来自互联网的印地语-英语双语文本,记录了印地语句子及其对应的英语翻译。主要特征如下:...
    packageimg
  • 印地语-英语翻译文本数据集Hindi-EnglishTranslationDataset-sasikr

    2025年4月29日   

    印地语-英语翻译文本数据集Hindi-EnglishTranslationDataset-sasikr 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 印地语, 英语, 语言学, 自然语言处理, 双语语料库, 文本对齐 数据概述: 该数据集包含来自公开来源的印地语-英语双语文本,记录了印地语文本及其对应的英语翻译。主要特征如下:...
    packageimg
  • 英泰翻译质量评估数据集

    2025年4月27日   

    英泰翻译质量评估数据集 数据来源:互联网公开数据 标签:翻译质量,机器翻译,情感分析,英泰双语,自然语言处理,NLP 数据概述:...
    packageimg
  • AES-2回译多语种数据集

    2025年4月27日   

    AES-2回译多语种数据集 数据来源:互联网公开数据 标签:回译,多语种,数据增强,自然语言处理,机器翻译,AES-2竞赛,跨语言分析 数据概述:...
    packageimg
  • 语言模型生成文本数据集Alpaca-FLANOutputsDataset-varun500

    2025年4月26日   

    语言模型生成文本数据集Alpaca-FLANOutputsDataset-varun500 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,语言模型,机器学习,人工智能,机器翻译,对话系统 数据概述: 该数据集包含来自Alpaca和FLAN语言模型的生成文本数据,记录了语言模型在多种任务中的文本生成结果。主要特征如下:...
    packageimg
  • 大规模语言模型微调数据集Fine-tuningNewDataset-inductiveanks

    2025年4月26日   

    大规模语言模型微调数据集Fine-tuningNewDataset-inductiveanks 数据来源:互联网公开数据 标签:自然语言处理,数据集,语言模型,微调,文本生成,机器翻译,问答系统,深度学习 数据概述: 该数据集包含用于微调大规模语言模型的数据,涵盖了多种自然语言处理任务。主要特征如下:...
    packageimg
  • 英阿翻译数据集TranslationEnglishArabicDataset-yumnagamal

    2025年4月26日   

    英阿翻译数据集TranslationEnglishArabicDataset-yumnagamal 数据来源:互联网公开数据 标签:机器翻译,英阿翻译,数据集,自然语言处理,文本分析,语言学,深度学习,NLP 数据概述: 该数据集包含英阿双语的翻译文本数据,记录了英语到阿拉伯语的翻译内容。主要特征如下: 时间跨度:...
    packageimg
  • 机器翻译模型数据集TranslationModelDataset-osamaabobakr

    2025年4月26日   

    机器翻译模型数据集TranslationModelDataset-osamaabobakr 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,语言模型,深度学习,人工智能,文本分析,多语言翻译 数据概述: 该数据集包含来自多个来源的多语言文本数据,用于训练和评估机器翻译模型。主要特征如下:...
    packageimg
  • 自然语言处理任务数据集NLPAssignment4Dataset-onkarsawant5613

    2025年4月26日   

    自然语言处理任务数据集NLPAssignment4Dataset-onkarsawant5613 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器翻译,情感分析,文本分类,深度学习,语言模型 数据概述:该数据集包含用于自然语言处理任务的文本数据,涵盖了多种语言和任务类型。主要特征如下:...
    packageimg
  • 罗马数字到印地语转换数据集-dushyantsingh1

    2025年4月26日   

    罗马数字到印地语转换数据集-dushyantsingh1 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,印地语,罗马数字,文本转换,语言模型,印度文化 数据概述: 该数据集包含了罗马数字和对应的印地语数字的转换对,旨在促进罗马数字到印地语数字的自动转换。主要特征如下: 时间跨度:数据涵盖了现代罗马数字和印地语数字的表示。...
    packageimg
  • EEDI预训练混合数据集EEDIEmbedPretrainMixFinalDataset-conjuring92

    2025年4月26日   

    EEDI预训练混合数据集EEDIEmbedPretrainMixFinalDataset-conjuring92 数据来源:互联网公开数据 标签:自然语言处理,预训练,数据集,文本嵌入,深度学习,语言模型,机器翻译,文本生成 数据概述: 该数据集是EEDI项目用于预训练的最终混合数据集,包含了多种来源的文本数据,旨在提升语言模型的性能。主要特征如下:...
    packageimg
  • 自然语言处理BeamSearch结果数据集-r00man

    2025年4月26日   

    自然语言处理BeamSearch结果数据集-r00man 数据来源:互联网公开数据 标签:自然语言处理,Beam Search,数据集,文本生成,机器翻译,序列标注,深度学习,模型评估 数据概述: 该数据集包含了使用Beam Search算法生成的自然语言处理任务结果。主要特征如下: 时间跨度:数据生成时间为特定任务训练和推理的时间。...
    packageimg
  • 孟加拉语新闻摘要数据集ProthomAlo-towhidahmedfoysal

    2025年4月26日   

    孟加拉语新闻摘要数据集ProthomAlo-towhidahmedfoysal 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,孟加拉语,新闻,数据集,NLP,机器翻译,语言模型 数据概述: 该数据集包含来自孟加拉语新闻网站Prothom Alo的新闻文章及其摘要。主要特征如下: 时间跨度:数据记录的时间范围未知,但涵盖了Prothom...
    packageimg
  • 仅英文MT5翻译数据集OnlyEnglishMT5TranslationDataset-parthplc

    2025年4月26日   

    仅英文MT5翻译数据集OnlyEnglishMT5TranslationDataset-parthplc 数据来源:互联网公开数据 标签:机器翻译,数据集,文本翻译,自然语言处理,英语,多语言,深度学习,NLP 数据概述: 该数据集包含了用于训练和评估多语言翻译模型(MT5)的英语翻译数据,专注于英语与其他语言之间的翻译。主要特征如下:...
    packageimg
  • JigsawTPU验证与测试数据翻译数据集JigsawTPUValidationandTestDataTranslatedDataset-ma7555

    2025年4月26日   

    JigsawTPU验证与测试数据翻译数据集JigsawTPUValidationandTestDataTranslatedDataset-ma7555 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,文本分类,深度学习,数据验证,人工智能,语言模型 数据概述: 该数据集包含来自 Jigsaw 项目的数据,记录了用于验证和测试...
    packageimg
  • 蜘蛛翻译数据集SpiderTranslationDataset-ahmedheakl2020

    2025年4月26日   

    蜘蛛翻译数据集SpiderTranslationDataset-ahmedheakl2020 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,文本翻译,深度学习,语言模型,翻译研究,计算机科学 数据概述: 该数据集包含来自Spider项目的翻译数据,记录了多种语言之间的文本翻译对。主要特征如下:...
    packageimg
  • 中德小型语料库数据集IDXSSmallEN-DEDataset-drishyaenagpal

    2025年4月26日   

    中德小型语料库数据集IDXSSmallEN-DEDataset-drishyaenagpal 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,翻译研究,语言学,文本分析,人工智能,多语言学习 数据概述:该数据集包含来自IDXS项目的小型英语到德语语料库,适用于机器翻译和语言学研究。主要特征如下:...
    packageimg
  • 文本摘要生成数据集ExtractiveSummaryDataset-rizwanidrees

    2025年4月26日   

    文本摘要生成数据集ExtractiveSummaryDataset-rizwanidrees 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器翻译,深度学习,NLP,文本分析,语言模型 数据概述: 该数据集包含用于文本摘要任务的文本数据,旨在训练和评估自动文本摘要模型。主要特征如下: 时间跨度:...
    packageimg