找到26个数据集

标签: 翻译模型

过滤结果
  • Telugu_Suicide_Based心理健康检测泰卢固语文本数据集

    2026年2月6日 30 40 28

    数据集概述 本数据集是Kaggle英文自杀检测数据集前5万行的泰卢固语翻译版,使用IndicTrans2翻译模型生成。核心内容为含自杀倾向标注的泰卢固语文本,每条数据包含文本内容及“自杀倾向”或“非自杀倾向”的分类标签,旨在支持泰卢固语心理健康检测相关研究,共包含2个文件。 文件详解 README.md 文件格式:MD...
    packageimg
  • WMT17_Based_生物医学翻译任务Scielo测试与黄金数据集

    2026年1月27日 30 188 114

    数据集概述 本数据集为第二届机器翻译会议(WMT'17)生物医学翻译任务的测试与黄金数据集,包含测试文件、黄金文件及使用GMA工具生成的自动对齐文件,数据来源于Scielo数据库,以压缩包形式提供。 文件详解 文件名称:wmt17-biomedical-scielo.zip 文件格式:ZIP 字段映射介绍:压缩包内包含三类文件:测试文件(Test...
    packageimg
  • WMT16_Based_Medline生物医学翻译任务平行语料数据集

    2026年1月25日 30 135 100

    数据集概述 本数据集为WMT'16生物医学翻译任务提供的平行语料,源自Medline/PubMed数据库,包含西班牙语-英语、法语-英语、葡萄牙语-英语三种语言对的平行文本数据,支持生物医学领域的机器翻译模型训练与评估。 文件详解 文件名称:pubmed_en_pt.txt.zip 文件格式:ZIP 字段映射介绍:包含英语-葡萄牙语生物医学平行文本数据...
    packageimg
  • 低资源语言数据集_基于肯尼亚本土语言与斯瓦希里语的平行语料库_v1_0_0

    2026年1月21日 30 95 90

    数据集概述 本数据集包含肯尼亚三种本土语言(Kidaw'ida、Kalenjin、Dholuo)与斯瓦希里语的平行语料库,每种语料库平均含三万句对,用于训练机器翻译模型,支持斯瓦希里语与本土语言间的翻译,由USIU-Africa等机构研究者创建,将持续更新优化。 文件详解 文件名称:waleghwa/low-resource-language-...
    packageimg
  • 孟加拉语机器翻译数据集

    2025年5月31日 30 39 31

    孟加拉语机器翻译数据集 数据来源:互联网公开数据 标签:机器翻译,孟加拉语,英文,自然语言处理,双语数据,文本分析,语言模型,翻译模型 数据概述:...
    packageimg
  • 英法翻译数据集English-to-FrenchTranslationDataset-othmansamih

    2025年5月30日 30 56 2

    英法翻译数据集English-to-FrenchTranslationDataset-othmansamih 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,英法翻译,语言模型,文本数据,深度学习,翻译模型 数据概述: 该数据集包含英语到法语的翻译文本数据,旨在用于机器翻译模型的训练和评估。主要特征如下:...
    packageimg
  • 多语言翻译平行语料数据集MultilingualTranslationParallelCorpus-juanjosmorenogiraldo

    2025年5月30日 30 33 21

    多语言翻译平行语料数据集MultilingualTranslationParallelCorpus-juanjosmorenogiraldo 数据来源:互联网公开数据 标签:机器翻译, 语料库, 自然语言处理, 语言学, 翻译模型, 文本数据, 英语, 德语, 西班牙语 数据概述:...
    packageimg
  • 机器翻译训练与评估数据集NMTTranslationDataset-jeevats

    2025年5月29日 30 18 16

    机器翻译训练与评估数据集NMTTranslationDataset-jeevats 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,翻译模型,文本分析,多语言,深度学习,人工智能 数据概述: 该数据集包含用于机器翻译任务的双语平行文本数据,记录了源语言和目标语言之间的翻译对。主要特征如下:...
    packageimg
  • 英法双语翻译短语数据集English-FrenchBilingualTranslationPhrases-nibakh

    2025年5月15日 30 177 125

    英法双语翻译短语数据集English-FrenchBilingualTranslationPhrases-nibakh 数据来源:互联网公开数据 标签:机器翻译, 语言学, 双语语料库, 文本数据, 自然语言处理, 翻译模型, 语言对, 语料分析 数据概述: 该数据集包含英法双语短语翻译数据,记录了英语短语及其对应的法语翻译。主要特征如下:...
    packageimg
  • 泰卢固语文本翻译数据集TeluguTextTranslationDataset-singh94135

    2025年5月14日 30 103 29

    泰卢固语文本翻译数据集TeluguTextTranslationDataset-singh94135 数据来源:互联网公开数据 标签:机器翻译, 泰卢固语, 语言学, 文本数据, 自然语言处理, 翻译模型, 双语对照, 数据集 数据概述: 该数据集包含泰卢固语的文本翻译数据,记录了泰卢固语词汇或短语及其对应的翻译。主要特征如下:...
    packageimg
  • 法语文本翻译数据集FrenchTextTranslation-aadiwalid

    2025年5月14日 30 93 41

    法语文本翻译数据集FrenchTextTranslation-aadiwalid 数据来源:互联网公开数据 标签:机器翻译, 法语, 文本数据, 自然语言处理, 语料库, 语言学, 数据分析, 翻译模型 数据概述: 该数据集包含来自互联网的法语文本片段,主要用于机器翻译模型的训练和评估。主要特征如下: 时间跨度:数据未明确标注时间,可视为静态文本语料。...
    packageimg
  • 印地语-英语翻译数据集Hindi-EnglishTranslationDataset-aryaumesh

    2025年5月8日 30 73 39

    印地语-英语翻译数据集Hindi-EnglishTranslationDataset-aryaumesh 数据来源:互联网公开数据 标签:机器翻译, 语言学, 印地语, 英语, 翻译模型, 双语对照, 文本数据, 自然语言处理 数据概述: 该数据集包含来自互联网的英语-印地语翻译对照数据,记录了英语短语或单词及其对应的印地语翻译。主要特征如下:...
    packageimg
  • 日语-英语机器翻译平行语料数据集Japanese-EnglishMachineTranslationParallelCorpus-arvindvasa

    2025年4月29日 30 142 138

    日语-英语机器翻译平行语料数据集Japanese-EnglishMachineTranslationParallelCorpus-arvindvasa 数据来源:互联网公开数据 标签:机器翻译, 语料库, 日语, 英语, 文本数据, 自然语言处理, 语言学习, 翻译模型 数据概述:...
    packageimg
  • 英语-泰卢固语翻译数据集English-TeluguTranslationDataset-peaking1

    2025年4月29日 30 83 7

    英语-泰卢固语翻译数据集English-TeluguTranslationDataset-peaking1 数据来源:互联网公开数据 标签:机器翻译, 语言学习, 文本翻译, 泰卢固语, 英语, 翻译模型, 自然语言处理, 语料库 数据概述: 该数据集包含英语到泰卢固语的翻译文本对,记录了英语短语或句子及其对应的泰卢固语翻译。主要特征如下:...
    packageimg
  • 越南语-英语翻译语句数据集Vietnamese-EnglishTranslationSentences-khanhxoe

    2025年4月29日 30 89 15

    越南语-英语翻译语句数据集Vietnamese-EnglishTranslationSentences-khanhxoe 数据来源:互联网公开数据 标签:机器翻译, 语言学习, 越南语, 英语, 文本数据, 翻译模型, 双语对照, 语料库 数据概述: 该数据集包含来自公共资源的越南语-英语翻译语句对,记录了英语语句及其对应的越南语翻译。主要特征如下:...
    packageimg
  • 中英翻译短语句对数据集English-ChineseTranslationSentencePairs-jstar123

    2025年4月29日 30 53 3

    中英翻译短语句对数据集English-ChineseTranslationSentencePairs-jstar123 数据来源:互联网公开数据 标签:机器翻译, 语言学, 文本数据, 中文, 英文, 翻译模型, 双语语料库, 自然语言处理 数据概述: 该数据集包含中英双语的短语句对,记录了英文短语及其对应的中文翻译。主要特征如下:...
    packageimg
  • 僧伽罗语-英语翻译数据集Sinhala-EnglishTranslationDataset-uom23mlmsc239337p

    2025年4月29日 30 3 1

    僧伽罗语-英语翻译数据集Sinhala-EnglishTranslationDataset-uom23mlmsc239337p 数据来源:互联网公开数据 标签:机器翻译, 语言翻译, 僧伽罗语, 英语, 文本数据, 语料库, 自然语言处理, 翻译模型 数据概述: 该数据集包含来自多种来源的僧伽罗语-...
    packageimg
  • 英语-印地语翻译训练数据集English-HindiTranslationTrainingDataset-jaydee29

    2025年4月24日 30 196 163

    英语-印地语翻译训练数据集English-HindiTranslationTrainingDataset-jaydee29 数据来源:互联网公开数据 标签:机器翻译,多语言,数据集,自然语言处理,语言技术,翻译模型,人工智能,语言学习 数据概述:该数据集包含英语到印地语的平行语料,主要用于机器翻译模型的训练和评估。主要特征如下:...
    packageimg
  • 英语到泰卢固语翻译数据集-krizzna69

    2025年4月24日 30 182 157

    英语到泰卢固语翻译数据集-krizzna69 数据来源:互联网公开数据 标签:机器翻译,语言学,数据集,泰卢固语,英语,自然语言处理,深度学习,翻译模型 数据概述: 该数据集包含英语到泰卢固语的翻译数据,记录了英语句子及其对应的泰卢固语翻译。主要特征如下: 时间跨度:数据记录的时间跨度不限,通常涵盖不同时期和语境下的翻译。...
    packageimg
  • 自然语言处理NLP神经机器翻译数据集NN-NLPNeuralMachineTranslationDataset-tarekelkhateb

    2025年4月22日 30 111 24

    自然语言处理NLP神经机器翻译数据集NN-NLPNeuralMachineTranslationDataset-tarekelkhateb 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,深度学习,神经网络,文本处理,语言模型,翻译模型 数据概述:...
    packageimg