-
用户指令意图理解意图改写数据集UserCommandIntentParaphrasingDataset-panjie23
用户指令意图理解意图改写数据集UserCommandIntentParaphrasingDataset-panjie23 数据来源:互联网公开数据 标签:意图识别, 文本生成, 语义理解, 机器翻译, 数据增强, 自然语言处理, 对话系统, 语料库 数据概述:... -
商品店铺俄语翻译数据集ProductShopRussianTranslationDataset-rickykonwar
商品店铺俄语翻译数据集ProductShopRussianTranslationDataset-rickykonwar 数据来源:互联网公开数据 标签:俄语翻译, 商品店铺, 文本翻译, 语言模型, 机器翻译, 零售业, 数据清洗, 自然语言处理 数据概述: 该数据集包含来自俄罗斯零售店铺的商品店铺名称的俄语原文及其对应的英文翻译。主要特征如下:... -
产品组装SOP中越双语对照数据集ProductAssemblySOPBilingualDataset-paxhaui
产品组装SOP中越双语对照数据集ProductAssemblySOPBilingualDataset-paxhaui 数据来源:互联网公开数据 标签:产品组装, SOP, 中越对照, 文本翻译, 双语语料库, 质量检测, 制造业, 机器翻译 数据概述:... -
自然语言理解Transformer模型训练与推理数据集NaturalLanguageUnderstandingTransformerModelTraini...
自然语言理解Transformer模型训练与推理数据集NaturalLanguageUnderstandingTransformerModelTrainingandInferenceDataset-daominhkhanh 数据来源:互联网公开数据 标签:自然语言处理, Transformer, 文本分类, 机器翻译, 文本生成, 模型训练,... -
多语言数字转录数据集MultilingualNumberTranscriptionDataset-shubhamprakash108
多语言数字转录数据集MultilingualNumberTranscriptionDataset-shubhamprakash108 数据来源:互联网公开数据 标签:多语言, 数字转录, 语音识别, 文本翻译, 语言学, 数据集, 文本处理, 机器翻译 数据概述: 该数据集包含多种语言的数字转录数据,记录了数字与其在不同语言中的对应表达。主要特征如下:... -
文本语义相似度判断数据集TextSemanticSimilarityJudgementDataset-saikoushik123
文本语义相似度判断数据集TextSemanticSimilarityJudgementDataset-saikoushik123 数据来源:互联网公开数据 标签:文本相似度, 语义分析, 自然语言处理, 文本匹配, 数据标注, 机器翻译, 深度学习, 对比分析 数据概述:... -
图像-文本多模态泰国旅游场景数据集Image-TextMultimodalThaiTravelDataset-shinupizza
图像-文本多模态泰国旅游场景数据集Image-TextMultimodalThaiTravelDataset-shinupizza 数据来源:互联网公开数据 标签:图像识别, 文本描述, 多模态, 泰国旅游, 图像标注, 机器翻译, 深度学习, 自然语言处理 数据概述: 该数据集包含来自互联网的泰国旅游场景图像及其对应的泰语描述文本。主要特征如下:... -
多语言商品图像描述数据集MultilingualProductImageDescriptionDataset-kounocchi
多语言商品图像描述数据集MultilingualProductImageDescriptionDataset-kounocchi 数据来源:互联网公开数据 标签:图像描述, 多语言, 商品识别, 文本生成, 机器翻译, 跨模态, 视觉语言, 数据标注 数据概述:... -
俄语评论情感分析数据集RussianReviewsSentimentAnalysisDataset-alpin0s
俄语评论情感分析数据集RussianReviewsSentimentAnalysisDataset-alpin0s 数据来源:互联网公开数据 标签:情感分析, 俄语, 评论, 文本分类, 自然语言处理, 机器翻译, 文本预处理, 深度学习 数据概述:... -
英语-泰卢固语平行语料库数据集English-TeluguParallelCorpus-adityaaluri
英语-泰卢固语平行语料库数据集English-TeluguParallelCorpus-adityaaluri 数据来源:互联网公开数据 标签:机器翻译, 语料库, 语言学, 英语, 泰卢固语, 自然语言处理, 双语对照, 数据集 数据概述:... -
多语言医学问答疾病治疗数据集MultilingualMedicalQuestionAnsweringDiseaseTreatmentDataset-sha...
多语言医学问答疾病治疗数据集MultilingualMedicalQuestionAnsweringDiseaseTreatmentDataset-shashwatnaidu 数据来源:互联网公开数据 标签:医学问答, 多语言, 疾病治疗, 自然语言处理, 机器翻译, 文本分析, 信息检索, 医疗健康 数据概述:... -
越南语-英语翻译语句数据集Vietnamese-EnglishTranslationSentences-khanhxoe
越南语-英语翻译语句数据集Vietnamese-EnglishTranslationSentences-khanhxoe 数据来源:互联网公开数据 标签:机器翻译, 语言学习, 越南语, 英语, 文本数据, 翻译模型, 双语对照, 语料库 数据概述: 该数据集包含来自公共资源的越南语-英语翻译语句对,记录了英语语句及其对应的越南语翻译。主要特征如下:... -
英汉平行语料翻译数据集English-ChineseParallelCorpusTranslation-trid4012
英汉平行语料翻译数据集English-ChineseParallelCorpusTranslation-trid4012 数据来源:互联网公开数据 标签:机器翻译, 语料库, 文本对齐, 双语对照, 语言学, 自然语言处理, 翻译质量评估, 文本分析 数据概述: 该数据集包含英汉双语平行语料,记录了英文句子及其对应的中文翻译。主要特征如下:... -
波斯语蕴含关系文本数据集FarsTailTextualEntailmentDataset-hadibabalou
波斯语蕴含关系文本数据集FarsTailTextualEntailmentDataset-hadibabalou 数据来源:互联网公开数据 标签:文本蕴含, 自然语言处理, 波斯语, 语义推理, 文本分类, 机器翻译, 数据集构建, 语言学 数据概述: 该数据集包含波斯语文本蕴含关系数据,用于训练和评估文本蕴含模型。主要特征如下:... -
多语言翻译文本数据集MultilingualTranslationTextDataset-bolinz
多语言翻译文本数据集MultilingualTranslationTextDataset-bolinz 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 多语言, 语料库, 语言学, 自然语言处理, 文本分析, 语言对 数据概述: 该数据集包含多种语言的翻译文本对,旨在支持机器翻译模型的训练和评估。主要特征如下:... -
文本生成评估数据集TextGenerationEvaluation-joederosa
文本生成评估数据集TextGenerationEvaluation-joederosa 数据来源:互联网公开数据 标签:文本生成, 自然语言处理, 机器翻译, 摘要生成, 文本质量, 数据集, 对比分析, 语言模型 数据概述: 该数据集包含用于评估文本生成模型的数据,记录了原始文本、生成文本及相关评估信息。主要特征如下:... -
乌尔都语新闻摘要数据集UrduNewsSummaryDataset-mmuneebiftikhar
乌尔都语新闻摘要数据集UrduNewsSummaryDataset-mmuneebiftikhar 数据来源:互联网公开数据 标签:新闻摘要, 乌尔都语, 文本摘要, 自然语言处理, 语料库, 文本分析, 机器翻译, 语言模型 数据概述:... -
医学文本摘要生成训练数据集MedicalTextSummarizationTrainingDataset-harishek1995
医学文本摘要生成训练数据集MedicalTextSummarizationTrainingDataset-harishek1995 数据来源:互联网公开数据 标签:医学, 文本摘要, 自然语言处理, 机器翻译, 训练数据, 命名实体识别, 文本生成, 对抗训练 数据概述:... -
多语言自然语言推理训练数据集MultilingualNaturalLanguageInferenceTrainingDataset-renadashraf
多语言自然语言推理训练数据集MultilingualNaturalLanguageInferenceTrainingDataset-renadashraf 数据来源:互联网公开数据 标签:自然语言推理, 文本蕴含, 多语言, 文本匹配, 机器翻译, 情感分析, 语义理解, 语言学 数据概述:... -
数据库查询语句生成数据集DatabaseQueryGenerationDataset-hinduhuman
数据库查询语句生成数据集DatabaseQueryGenerationDataset-hinduhuman 数据来源:互联网公开数据 标签:数据库, 自然语言处理, 文本生成, SQL, 语义解析, 问答系统, 数据集, 机器翻译 数据概述:...