-
多语言翻译文本数据集MultilingualTranslationTextDataset-duy52000751
多语言翻译文本数据集MultilingualTranslationTextDataset-duy52000751 数据来源:互联网公开数据 标签:机器翻译, 文本对齐, 语言模型, 文本数据, 越南语, 西班牙语, 英语, 数据集 数据概述:... -
机器翻译模型评估数据集MachineTranslationModelEvaluationDataset-annieblare
机器翻译模型评估数据集MachineTranslationModelEvaluationDataset-annieblare 数据来源:互联网公开数据 标签:机器翻译, 文本分析, 语言模型, 困惑度, ChrF评分, 翻译质量, 跨语言, 文本对齐 数据概述:... -
机器学习入门视频摘要与文本数据集MachineLearningIntroductoryVideoSummariesandTranscripts-aneka...
机器学习入门视频摘要与文本数据集MachineLearningIntroductoryVideoSummariesandTranscripts-anekantsinghai 数据来源:互联网公开数据 标签:机器学习, 视频摘要, 文本分析, 自然语言处理, 课程资源, 教学视频, 文本摘要, 机器翻译 数据概述:... -
俄语翻译平行语料数据集Russian-EnglishParallelCorpus-etosyoma
俄语翻译平行语料数据集Russian-EnglishParallelCorpus-etosyoma 数据来源:互联网公开数据 标签:机器翻译, 俄语, 英语, 语料库, 文本对齐, 自然语言处理, 语言学, 数据集 数据概述: 该数据集包含俄语与英语的平行文本,记录了俄语原文及其对应的英语译文。主要特征如下:... -
印尼多语言平行语料库-爪哇语-巽他语和马来语文本数据集IndonesianMultilingualParallelCorpus-Javanese-Sund...
印尼多语言平行语料库-爪哇语-巽他语和马来语文本数据集IndonesianMultilingualParallelCorpus-Javanese-Sundanese-andMalayTextDataset-alfaariizii 数据来源:互联网公开数据 标签:平行语料库, 机器翻译, 语言学, 爪哇语, 巽他语, 马来语, 文本数据, 自然语言处理... -
越南语-英语语义相似度分析数据集Vietnamese-EnglishSemanticSimilarityAnalysisDataset-dangthai
越南语-英语语义相似度分析数据集Vietnamese-EnglishSemanticSimilarityAnalysisDataset-dangthai 数据来源:互联网公开数据 标签:语义相似度, 越南语, 英语, 文本匹配, 自然语言处理, 机器翻译, 双语语料, 文本对 数据概述: 该数据集包含越南语-... -
印地语-英语翻译指令数据集Hindi-EnglishTranslationInstructionDataset-jaydee29
印地语-英语翻译指令数据集Hindi-EnglishTranslationInstructionDataset-jaydee29 数据来源:互联网公开数据 标签:机器翻译, 语言翻译, 印地语, 英语, 自然语言处理, 文本翻译, 数据标注, 多语言 数据概述: 该数据集包含来自公开渠道的印地语-... -
日语-英语机器翻译平行语料数据集Japanese-EnglishMachineTranslationParallelCorpus-arvindvasa
日语-英语机器翻译平行语料数据集Japanese-EnglishMachineTranslationParallelCorpus-arvindvasa 数据来源:互联网公开数据 标签:机器翻译, 语料库, 日语, 英语, 文本数据, 自然语言处理, 语言学习, 翻译模型 数据概述:... -
英语-泰卢固语翻译数据集English-TeluguTranslationDataset-peaking1
英语-泰卢固语翻译数据集English-TeluguTranslationDataset-peaking1 数据来源:互联网公开数据 标签:机器翻译, 语言学习, 文本翻译, 泰卢固语, 英语, 翻译模型, 自然语言处理, 语料库 数据概述: 该数据集包含英语到泰卢固语的翻译文本对,记录了英语短语或句子及其对应的泰卢固语翻译。主要特征如下:... -
多语言文本蕴含关系判断数据集MultilingualTextualEntailmentRelationshipJudgment-tuckerarrants
多语言文本蕴含关系判断数据集MultilingualTextualEntailmentRelationshipJudgment-tuckerarrants 数据来源:互联网公开数据 标签:文本蕴含, 自然语言处理, 多语言, 语义推理, 文本匹配, 情感分析, 机器翻译, 语料库 数据概述:... -
普什图语情感分析语料数据集PashtoSentimentAnalysisCorpus-drijaz
普什图语情感分析语料数据集PashtoSentimentAnalysisCorpus-drijaz 数据来源:互联网公开数据 标签:情感分析, 普什图语, 文本分类, 机器翻译, 自然语言处理, 语料库, 阿富汗, 情感极性 数据概述: 该数据集包含普什图语文本及其对应的情感标签和英文翻译。主要特征如下: 时间跨度:数据未明确标注时间,可视为静态语料。... -
印地语-英语翻译数据集Hindi-EnglishTranslationDataset-donutkashvi
印地语-英语翻译数据集Hindi-EnglishTranslationDataset-donutkashvi 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 印地语, 英语, 自然语言处理, 语言对, 语料库, 文本生成 数据概述: 该数据集包含英语到印地语的翻译文本对,旨在用于机器翻译模型的训练和评估。主要特征如下:... -
阿拉伯语-英语翻译挑战数据集Arabic-EnglishTranslationChallengeDataset-mohamedabderraouf
阿拉伯语-英语翻译挑战数据集Arabic-EnglishTranslationChallengeDataset-mohamedabderraouf 数据来源:互联网公开数据 标签:机器翻译, 语言学, 阿拉伯语, 英语, 文本翻译, 数据集, 自然语言处理, 语言对 数据概述: 该数据集包含来自多个领域的阿拉伯语-... -
文本相似度比较数据集TextSimilarityComparisonDataset-parthivadholaria
文本相似度比较数据集TextSimilarityComparisonDataset-parthivadholaria 数据来源:互联网公开数据 标签:文本相似度, 自然语言处理, 句子对, 语义分析, 文本匹配, 机器翻译, 深度学习, 数据集构建 数据概述: 该数据集包含来自公开渠道的文本数据,记录了句子对之间的相似性比较结果。主要特征如下:... -
自然语言理解COLA数据集训练与测试NaturalLanguageUnderstandingCOLADatasetTrainandTest-aryansakhala
自然语言理解COLA数据集训练与测试NaturalLanguageUnderstandingCOLADatasetTrainandTest-aryansakhala 数据来源:互联网公开数据 标签:自然语言处理, 文本分类, 句法分析, 语言模型, 文本理解, 机器翻译, 语义分析, 训练集 数据概述:... -
尼泊尔语拼写纠错数据集NepaliSpellingCorrectionDataset-amardura
尼泊尔语拼写纠错数据集NepaliSpellingCorrectionDataset-amardura 数据来源:互联网公开数据 标签:拼写纠错, 尼泊尔语, 自然语言处理, 文本校对, 语言模型, 错误检测, 数据清洗, 机器翻译 数据概述: 该数据集包含尼泊尔语文本,记录了正确的文本及其对应的错误拼写形式,用于尼泊尔语拼写纠错任务。主要特征如下:... -
高棉语图像文本翻译与目标检测数据集KhmerTextTranslationandObjectDetectionDataset-veysreypich
高棉语图像文本翻译与目标检测数据集KhmerTextTranslationandObjectDetectionDataset-veysreypich 数据来源:互联网公开数据 标签:高棉语, 柬埔寨语, 机器翻译, 目标检测, OCR, 图像识别, 文本标注, 计算机视觉 数据概述:... -
多语言负面情绪文本数据集MultilingualNegativeSentimentTextData-adevannevessantos
多语言负面情绪文本数据集MultilingualNegativeSentimentTextData-adevannevessantos 数据来源:互联网公开数据 标签:情感分析, 负面情绪, 多语言, 文本数据, 自然语言处理, 机器翻译, 情感分类, 巴西葡萄牙语 数据概述:... -
多语言文本识别数据集MultilingualTextIdentification-iitm21f3001013
多语言文本识别数据集MultilingualTextIdentification-iitm21f3001013 数据来源:互联网公开数据 标签:文本识别,多语言,语言分类,自然语言处理,机器翻译,文本分析,语料库,印度语 数据概述: 该数据集包含来自多种印度语言的文本片段,旨在用于语言识别任务。主要特征如下:... -
Java代码翻译质量评估数据集JavaCodeTranslationQualityEvaluationDataset-ranimmhisham
Java代码翻译质量评估数据集JavaCodeTranslationQualityEvaluationDataset-ranimmhisham 数据来源:互联网公开数据 标签:代码翻译, 机器翻译, Java, 文本相似度, 编程语言, 质量评估, 机器学习, 语料分析 数据概述:...