-
图像描述生成英语文本数据集ImageCaptioningEnglishTextDataset-zeindea
图像描述生成英语文本数据集ImageCaptioningEnglishTextDataset-zeindea 数据来源:互联网公开数据 标签:图像描述, 文本生成, 计算机视觉, 自然语言处理, 机器翻译, 数据标注, 深度学习, 图像理解 数据概述: 该数据集包含来自互联网的图像描述数据,记录了图像与其对应的英文文本描述。主要特征如下:... -
自然语言处理课程作业代码数据集NaturalLanguageProcessingCourseworkCode-balasrinivishal
自然语言处理课程作业代码数据集NaturalLanguageProcessingCourseworkCode-balasrinivishal 数据来源:互联网公开数据 标签:自然语言处理, 机器翻译, 深度学习, Python, Jupyter Notebook, 课程作业, 代码示例, 神经网络 数据概述:... -
英法双语翻译对照数据集English-FrenchTranslationDataset-mansikasahoo2
英法双语翻译对照数据集English-FrenchTranslationDataset-mansikasahoo2 数据来源:互联网公开数据 标签:机器翻译, 语言学习, 双语对照, 文本数据, 自然语言处理, 语料库, 语言模型, 文本翻译 数据概述: 该数据集包含英法双语对照的翻译文本,记录了英语句子及其对应的法语翻译。主要特征如下:... -
孟加拉语翻译数据集BanglaTranslationDataset-emammame
孟加拉语翻译数据集BanglaTranslationDataset-emammame 数据来源:互联网公开数据 标签:机器翻译, 孟加拉语, 文本翻译, 自然语言处理, 语言模型, 文本数据, 语料库, 翻译 数据概述: 该数据集包含英语到孟加拉语的翻译文本对,用于机器翻译模型的训练和评估。主要特征如下:... -
文本校对与错误纠正数据集TextProofreadingandErrorCorrectionDataset-austuvarki
文本校对与错误纠正数据集TextProofreadingandErrorCorrectionDataset-austuvarki 数据来源:互联网公开数据 标签:文本校对, 错误纠正, 语言模型, 自然语言处理, 文本编辑, 语法纠错, 句子对齐, 机器翻译 数据概述:... -
自然语言理解Transformer模型训练与推理数据集NaturalLanguageUnderstandingTransformerModelTraini...
自然语言理解Transformer模型训练与推理数据集NaturalLanguageUnderstandingTransformerModelTrainingandInferenceDataset-dunglduy 数据来源:互联网公开数据 标签:自然语言处理, Transformer, 文本分类, 情感分析, 机器翻译, 预训练模型, 数据集构建,... -
多语言文档标识符数据集MultilingualDocumentIdentifierDataset-fredriknguyenepfl0
多语言文档标识符数据集MultilingualDocumentIdentifierDataset-fredriknguyenepfl0 数据来源:互联网公开数据 标签:文档标识, 多语言, 文本数据, 语料库, 语言识别, 数据清洗, 信息检索, 机器翻译 数据概述: 该数据集包含来自不同语言的文档标识符,记录了多种语言文档的唯一编号。主要特征如下:... -
多语言产品组装说明文本数据集MultilingualProductAssemblyInstructionTextDataset-patxhaui
多语言产品组装说明文本数据集MultilingualProductAssemblyInstructionTextDataset-patxhaui 数据来源:互联网公开数据 标签:产品组装, 多语言, 文本翻译, 机器翻译, 文本分类, 质量控制, 工业制造, 数据清洗 数据概述:... -
泰语图片描述数据集ThaiImageCaptioningDataset-spitiwan
泰语图片描述数据集ThaiImageCaptioningDataset-spitiwan 数据来源:互联网公开数据 标签:图像描述, 泰语, 机器翻译, 计算机视觉, 自然语言处理, 文本生成, 多模态学习, 图像识别 数据概述: 该数据集包含来自图像的数据,记录了泰语对图像的描述。主要特征如下:... -
泰卢固语词汇分割与分类训练数据集TeluguWordSegmentationandClassificationTrainingDataset-sriram...
泰卢固语词汇分割与分类训练数据集TeluguWordSegmentationandClassificationTrainingDataset-sriramgugulothu 数据来源:互联网公开数据 标签:泰卢固语, 文本分析, 词汇分割, 语言模型, 自然语言处理, 机器翻译, 文本分类, 数据集 数据概述:... -
文本相似度训练数据集TextSimilarityTrainingDataset-krilin
文本相似度训练数据集TextSimilarityTrainingDataset-krilin 数据来源:互联网公开数据 标签:文本相似度, 机器翻译, 文本匹配, 自然语言处理, 语料库, 文本分析, 语言模型, 相似度评估 数据概述: 该数据集包含来自互联网的文本数据,记录了用于训练文本相似度模型的语料。主要特征如下:... -
英语语法纠错数据集EnglishGrammarCorrectionDataset-austuvarki
英语语法纠错数据集EnglishGrammarCorrectionDataset-austuvarki 数据来源:互联网公开数据 标签:语法纠错, 文本校对, 自然语言处理, 语言模型, 机器翻译, 文本生成, 英语学习, 数据增强 数据概述: 该数据集包含来自公开渠道的英语文本数据,记录了原始英文句子及其对应的语法纠正后的版本。主要特征如下:... -
印度新闻广播印地语语音转录文本数据集IndianNewsBroadcastHindiSpeechTranscriptDataset-pranav51286
印度新闻广播印地语语音转录文本数据集IndianNewsBroadcastHindiSpeechTranscriptDataset-pranav51286 数据来源:互联网公开数据 标签:语音识别, 文本转录, 印地语, 新闻广播, 语言学, 声音数据, 机器翻译, 语料库 数据概述:... -
民事诉讼摘要生成文本数据集CivilLitigationSummaryGenerationTextDataset-mlexploreraaditya
民事诉讼摘要生成文本数据集CivilLitigationSummaryGenerationTextDataset-mlexploreraaditya 数据来源:互联网公开数据 标签:民事诉讼, 文本摘要, 自然语言处理, 摘要生成, 法律文本, 机器翻译, 文本分析, 深度学习 数据概述:... -
英语西班牙语翻译对照数据集English-SpanishTranslationPairs-nouranader
英语西班牙语翻译对照数据集English-SpanishTranslationPairs-nouranader 数据来源:互联网公开数据 标签:机器翻译, 语言学习, 词汇对照, 文本数据, 西班牙语, 英语, 数据集, 翻译 数据概述:... -
WebNLG2022训练数据文本生成数据集WebNLG2022TrainingDataTextGeneration-thedatadynamo
WebNLG2022训练数据文本生成数据集WebNLG2022TrainingDataTextGeneration-thedatadynamo 数据来源:互联网公开数据 标签:文本生成, 自然语言处理, 数据集, 知识图谱, 语义解析, 机器翻译, 语言模型, 数据增强 数据概述: 该数据集包含来自WebNLG 2022... -
英语-马拉雅拉姆语平行语料库数据集English-MalayalamParallelCorpus-alakaru
英语-马拉雅拉姆语平行语料库数据集English-MalayalamParallelCorpus-alakaru 数据来源:互联网公开数据 标签:机器翻译, 语料库, 双语对照, 自然语言处理, 语言学, 文本数据, 英语, 马拉雅拉姆语 数据概述: 该数据集包含英语和马拉雅拉姆语的平行文本,用于机器翻译和跨语言分析。主要特征如下:... -
文本改写平行语料库数据集TextParaphraseCorpus-zahraasn
文本改写平行语料库数据集TextParaphraseCorpus-zahraasn 数据来源:互联网公开数据 标签:文本生成, 语义相似度, 句子改写, 自然语言处理, 机器翻译, 数据集构建, 文本多样性, 对比学习 数据概述: 该数据集包含用于文本改写的平行语料库,记录了原始句子及其对应的改写版本。主要特征如下:... -
多语言社交媒体内容分析数据集MultilingualSocialMediaContentAnalysisDataset-zakubovich
多语言社交媒体内容分析数据集MultilingualSocialMediaContentAnalysisDataset-zakubovich 数据来源:互联网公开数据 标签:社交媒体, 文本分析, 多语言, 内容分类, 情感分析, 机器翻译, 数据清洗, 语料库 数据概述:... -
多语言文本情感分析数据集MultilingualTextSentimentAnalysisDataset-rookiejing
多语言文本情感分析数据集MultilingualTextSentimentAnalysisDataset-rookiejing 数据来源:互联网公开数据 标签:情感分析, 文本分类, 多语言, 机器翻译, 自然语言处理, 情感标注, 文本情感, 数据集 数据概述:...