找到642个数据集

标签: 机器翻译

过滤结果
  • 英印翻译对照数据集SamanantarEnglishtoHindiDataset1-manavsarkar

    2025年5月29日   

    英印翻译对照数据集SamanantarEnglishtoHindiDataset1-manavsarkar 数据来源:互联网公开数据 标签:英印翻译,数据集,自然语言处理,机器翻译,语言学,人工智能,文本分析,语料库 数据概述: 该数据集包含来自Samanantar项目的英印翻译对照数据,记录了英文原文及其对应的印地文翻译。主要特征如下:...
    packageimg
  • 阿拉伯语文本情感分析Madar9数据集ArabicTextSentimentAnalysisMadar9Dataset-mafazachabane

    2025年5月29日   

    阿拉伯语文本情感分析Madar9数据集ArabicTextSentimentAnalysisMadar9Dataset-mafazachabane 数据来源:互联网公开数据 标签:情感分析, 自然语言处理, 文本分类, 阿拉伯语, 机器翻译, 深度学习, 文本预处理, 词嵌入 数据概述:...
    packageimg
  • 多语言新闻文章数据集Multi-NewsDataset-terrychanorg

    2025年5月29日   

    多语言新闻文章数据集Multi-NewsDataset-terrychanorg 数据来源:互联网公开数据 标签:新闻,多语言,数据集,自然语言处理,文本摘要,机器翻译,信息检索,文本分析 数据概述: 该数据集包含来自不同语言的新闻文章,用于文本摘要和多语言处理任务。主要特征如下: 时间跨度:数据记录的时间范围为不确定,取决于新闻来源的更新频率。...
    packageimg
  • 机器翻译与反译数据集JigsawBackTranslatedDatasetEncodedSeq192-linshokaku

    2025年5月29日   

    机器翻译与反译数据集JigsawBackTranslatedDatasetEncodedSeq192-linshokaku 数据来源:互联网公开数据 标签:机器翻译,反译,数据集,自然语言处理,深度学习,文本编码,语言模型,数据增强 数据概述:...
    packageimg
  • 音视频转录文本数据集Audio-to-TextTranscriptionDataset-yumoan

    2025年5月29日   

    音视频转录文本数据集Audio-to-TextTranscriptionDataset-yumoan 数据来源:互联网公开数据 标签:语音识别, 文本转录, 语音转文本, 音频分析, 深度学习, 自然语言处理, 数据标注, 机器翻译 数据概述: 该数据集包含来自公开音视频资源的转录文本数据,主要用于训练和评估语音转文本(STT)模型。主要特征如下:...
    packageimg
  • 多语言词对翻译数据集MultilingualWordPairTranslationDataset-jaswanth431

    2025年5月29日   

    多语言词对翻译数据集MultilingualWordPairTranslationDataset-jaswanth431 数据来源:互联网公开数据 标签:机器翻译, 词对翻译, 多语言, 文本数据, 印度语言, 文本分析, 自然语言处理, 语言学 数据概述: 该数据集包含来自不同印度语言的词对翻译数据,旨在促进多语言翻译模型的研究与开发。主要特征如下:...
    packageimg
  • 印地语-英语机器翻译Hinglish语料数据集Hindi-EnglishMachineTranslationHinglishCorpus-rohanjha23

    2025年5月29日   

    印地语-英语机器翻译Hinglish语料数据集Hindi-EnglishMachineTranslationHinglishCorpus-rohanjha23 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 多语言, 印度语, 英语, Hinglish, 语料库, 语言模型 数据概述:...
    packageimg
  • 英语到印地语翻译数据集English-to-HindiTranslationDataset-rkumarbengaluru

    2025年5月29日   

    英语到印地语翻译数据集English-to-HindiTranslationDataset-rkumarbengaluru 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,语言转换,印地语,英语,文本分析,语言学 数据概述: 该数据集包含英语到印地语的平行语料,记录了成对的英语原文和对应的印地语翻译。主要特征如下:...
    packageimg
  • 机器翻译训练与评估数据集NMTTranslationDataset-jeevats

    2025年5月29日   

    机器翻译训练与评估数据集NMTTranslationDataset-jeevats 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,翻译模型,文本分析,多语言,深度学习,人工智能 数据概述: 该数据集包含用于机器翻译任务的双语平行文本数据,记录了源语言和目标语言之间的翻译对。主要特征如下:...
    packageimg
  • 量子电路摘要生成数据集QuantumCircuitSummarization-mridul3301

    2025年5月29日   

    量子电路摘要生成数据集QuantumCircuitSummarization-mridul3301 数据来源:互联网公开数据 标签:量子计算, 文本摘要, 自然语言处理, 机器翻译, 科技文献, 深度学习, 数据集构建, 摘要生成 数据概述: 该数据集包含来自学术论文的数据,记录了量子电路领域的相关研究内容,并提供了对应的摘要。主要特征如下:...
    packageimg
  • 孟加拉语文本摘要数据集BanglaTextSummarizationDataset-devtousif

    2025年5月29日   

    孟加拉语文本摘要数据集BanglaTextSummarizationDataset-devtousif 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,语言模型,文本分析,机器翻译,文本生成 数据概述: 该数据集包含孟加拉语文本的摘要数据,记录了孟加拉语文章及其对应的摘要信息。主要特征如下:...
    packageimg
  • 印度新闻摘要文章数据集IndiaNewsSummaryArticleDataset-umangjjw

    2025年5月29日   

    印度新闻摘要文章数据集IndiaNewsSummaryArticleDataset-umangjjw 数据来源:互联网公开数据 标签:新闻摘要, 印度新闻, 文本摘要, 自然语言处理, 文本分析, 机器翻译, 语料库, 印度文化 数据概述: 该数据集包含来自印度新闻网站的文章及其摘要,旨在为自然语言处理和文本分析任务提供支持。主要特征如下:...
    packageimg
  • 文本摘要生成训练数据集TextSummarizationTrainingData-mridul3301

    2025年5月29日   

    文本摘要生成训练数据集TextSummarizationTrainingData-mridul3301 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 机器翻译, 深度学习, 摘要生成, 数据集, 文本处理, 语料库 数据概述: 该数据集包含用于文本摘要生成的训练数据,记录了原文与其对应的摘要文本。主要特征如下:...
    packageimg
  • 新闻摘要生成内容数据集NewsSummarizationContentDataset-sandeep16064

    2025年5月29日   

    新闻摘要生成内容数据集NewsSummarizationContentDataset-sandeep16064 数据来源:互联网公开数据 标签:文本摘要, 新闻摘要, 自然语言处理, 文本生成, 机器翻译, 深度学习, 语料库, 摘要模型 数据概述:...
    packageimg
  • 文本转述数据集TextParaphrasingDataset-soumyasangamjha

    2025年5月29日   

    文本转述数据集TextParaphrasingDataset-soumyasangamjha 数据来源:互联网公开数据 标签:文本转述, 自然语言处理, 机器翻译, 文本生成, 语义理解, 数据增强, 深度学习, 语料库 数据概述: 该数据集包含来自多个来源的文本转述对,记录了原始文本及其对应的转述版本,旨在用于训练和评估文本转述模型。主要特征如下:...
    packageimg
  • 量子物理摘要生成数据集QuantumPhysicsAbstractSummarization-mridul3301

    2025年5月28日   

    量子物理摘要生成数据集QuantumPhysicsAbstractSummarization-mridul3301 数据来源:互联网公开数据 标签:量子物理, 文本摘要, 机器翻译, 自然语言处理, 科学研究, 深度学习, 论文摘要, 学术文本 数据概述: 该数据集包含来自学术论文的摘要生成数据,记录了量子物理领域论文的原文与对应的摘要。主要特征如下:...
    packageimg
  • 自然语言处理Zalo排序竞赛数据集NaturalLanguageProcessingZaloRankingCompetitionDataset-anhbu...

    2025年5月28日   

    自然语言处理Zalo排序竞赛数据集NaturalLanguageProcessingZaloRankingCompetitionDataset-anhbuivuongtam 数据来源:互联网公开数据 标签:自然语言处理, 文本排序, 机器学习, 深度学习, 文本分类, 机器翻译, 数据竞赛, Transformer 数据概述:...
    packageimg
  • 照片翻译数据集PHOMTTranslationDataset-baotanguyen

    2025年5月28日   

    照片翻译数据集PHOMTTranslationDataset-baotanguyen 数据来源:互联网公开数据 标签:机器翻译,图像识别,数据集,多语言,计算机视觉,自然语言处理,人工智能,图像翻译 数据概述: 该数据集专注于照片翻译任务,包含大量带有文本信息的图像及其对应的翻译文本。主要特征如下:...
    packageimg
  • 翻译质量评估数据集QuACE数据集-emam2002

    2025年5月28日   

    翻译质量评估数据集QuACE数据集-emam2002 数据来源:互联网公开数据 标签:机器翻译,数据集,翻译质量评估,自然语言处理,文本分析,语言学,深度学习,文本相似度 数据概述: 该数据集包含来自 QuACE(Quality Assessment of Computer-Enhanced...
    packageimg
  • 英语到印地语翻译数据集-amnydv17

    2025年5月28日   

    英语到印地语翻译数据集-amnydv17 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,语言学,英语,印地语,文本翻译,深度学习 数据概述: 该数据集包含了大量的英语到印地语的翻译文本对,旨在用于机器翻译模型的训练和评估。主要特征如下: 时间跨度:数据集的构建时间跨度不固定,持续更新和扩展。...
    packageimg