-
卡纳达语与英语多语言数据集Kannada-EnglishMulti-lingualDataset-python16
卡纳达语与英语多语言数据集Kannada-EnglishMulti-lingualDataset-python16 数据来源:互联网公开数据 标签:多语言,卡纳达语,英语,数据集,自然语言处理,机器翻译,语言学研究,文本分析 数据概述: 该数据集包含卡纳达语与英语的多语言文本数据,记录了两种语言之间的文本对齐信息。主要特征如下:... -
电影评论情感分析数据集MovieReviewSentimentAnalysisDataset-flaviagg
电影评论情感分析数据集MovieReviewSentimentAnalysisDataset-flaviagg 数据来源:互联网公开数据 标签:情感分析, 文本挖掘, 自然语言处理, 电影评论, 葡萄牙语, 英语, 数据标注, 机器翻译 数据概述:... -
新闻摘要与原文对照分析数据集NewsSummaryandArticleAnalysis-saiganeshsriram
新闻摘要与原文对照分析数据集NewsSummaryandArticleAnalysis-saiganeshsriram 数据来源:互联网公开数据 标签:新闻摘要, 文本摘要, 自然语言处理, 文本分析, 信息检索, 机器翻译, 深度学习, 对比分析 数据概述:... -
印地语-英语平行语料翻译数据集Hindi-EnglishParallelCorpusTranslationDataset-swapanroy
印地语-英语平行语料翻译数据集Hindi-EnglishParallelCorpusTranslationDataset-swapanroy 数据来源:互联网公开数据 标签:机器翻译, 语料库, 印地语, 英语, 文本数据, 语言学, 双语对照, 自然语言处理 数据概述: 该数据集包含印地语-英语平行语料,记录了印地语和英语的句子对。主要特征如下:... -
数据2022年全国知识图谱与语义计算大会NLPCC2022多语言摘要生成数据集-basmarg
2022年全国知识图谱与语义计算大会NLPCC2022多语言摘要生成数据集-basmarg 数据来源:互联网公开数据 标签:自然语言处理,文本生成,多语言,学术论文,摘要生成,深度学习,机器翻译,语义计算 数据概述: 该数据集来源于2022年全国知识图谱与语义计算大会(NLPCC 2022),旨在促进多语言摘要生成的研究。主要特征如下:... -
英法平行语料库翻译数据集English-FrenchParallelCorpusTranslationDataset-phrasy
英法平行语料库翻译数据集English-FrenchParallelCorpusTranslationDataset-phrasy 数据来源:互联网公开数据 标签:机器翻译, 语料库, 自然语言处理, 文本翻译, 英法翻译, 数据集, 语言模型, 双语对照 数据概述: 该数据集包含英法双语平行语料,用于机器翻译模型的训练和评估。主要特征如下:... -
阿拉伯新闻摘要数据集ArabicNewsSummarizationDataset-abdelbassetdjamai
阿拉伯新闻摘要数据集ArabicNewsSummarizationDataset-abdelbassetdjamai 数据来源:互联网公开数据 标签:新闻摘要, 阿拉伯语, 文本摘要, 文本分析, 自然语言处理, 机器翻译, 语料库, 语言模型 数据概述: 该数据集包含来自阿拉伯新闻报道的摘要信息,旨在为阿拉伯语文本摘要任务提供数据支持。主要特征如下:... -
文本生成与润色评估数据集TextGenerationandRefinementEvaluationDataset-alvaromendizabal
文本生成与润色评估数据集TextGenerationandRefinementEvaluationDataset-alvaromendizabal 数据来源:互联网公开数据 标签:文本生成, 文本润色, 写作评估, 语言模型, 自然语言处理, 机器翻译, 错误检测, 内容质量 数据概述:... -
机器翻译模型训练数据集MachineTranslationModelTrainingDataset-duy52000751
机器翻译模型训练数据集MachineTranslationModelTrainingDataset-duy52000751 数据来源:互联网公开数据 标签:机器翻译, 文本编码, 深度学习, 自然语言处理, 神经网络, 数据集, 模型训练, 序列到序列 数据概述:... -
多语言恶意评论翻译与检测数据集MultilingualToxicCommentTranslationandDetectionDataset-mk9440
多语言恶意评论翻译与检测数据集MultilingualToxicCommentTranslationandDetectionDataset-mk9440 数据来源:互联网公开数据 标签:多语言, 文本翻译, 恶意评论, 文本分类, 自然语言处理, 机器翻译, 语料库, 文本分析 数据概述:... -
越南新闻文本摘要数据集VietnamNewsTextSummarizationDataset-hoathinguyet
越南新闻文本摘要数据集VietnamNewsTextSummarizationDataset-hoathinguyet 数据来源:互联网公开数据 标签:文本摘要, 新闻分析, 自然语言处理, 文本挖掘, 越南语, 标题生成, 摘要生成, 机器翻译 数据概述: 该数据集包含来自越南新闻网站的文章数据,旨在用于文本摘要和相关自然语言处理任务。主要特征如下:... -
文本摘要训练语料数据集TextSummarizationTrainingCorpus-iamgeniusstark
文本摘要训练语料数据集TextSummarizationTrainingCorpus-iamgeniusstark 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 语料库, 机器翻译, 深度学习, 文本生成, 数据集, 语料分析 数据概述: 该数据集包含用于训练文本摘要模型的语料,记录了原始文本及其对应的摘要信息。主要特征如下:... -
印地语词汇翻译对照数据集HindiVocabularyTranslationDataset-vivekreddybandi
印地语词汇翻译对照数据集HindiVocabularyTranslationDataset-vivekreddybandi 数据来源:互联网公开数据 标签:印地语, 词汇翻译, 文本数据, 机器翻译, 语言学, 数据集, 自然语言处理, 词典 数据概述: 该数据集包含印地语词汇与其对应的英文翻译,旨在促进印地语语言学习和机器翻译模型训练。主要特征如下:... -
数学问题文本分析与解答数据集MathProblemTextAnalysisandSolution-datamuchiashvili
数学问题文本分析与解答数据集MathProblemTextAnalysisandSolution-datamuchiashvili 数据来源:互联网公开数据 标签:数学问题, 文本分析, 自然语言处理, 机器翻译, 文本分类, 解题, 数据标注, 俄语 数据概述: 该数据集包含来自数学问题的数据,用于训练和评估数学问题理解与解答的模型。主要特征如下:... -
英汉阿拉伯语翻译数据集450-510句对-emam2002
英汉阿拉伯语翻译数据集450-510句对-emam2002 数据来源:互联网公开数据 标签:机器翻译,语言学,数据集,阿拉伯语,英语,翻译,自然语言处理,文本数据 数据概述: 该数据集包含450到510个英汉-阿拉伯语翻译对,旨在促进英汉和阿拉伯语之间的机器翻译研究和开发。主要特征如下: 时间跨度:数据主要集中在当前语言使用情境。... -
产品信息与描述文本数据集ProductInformationandDescriptionTextDataset-alexandrebeiruth
产品信息与描述文本数据集ProductInformationandDescriptionTextDataset-alexandrebeiruth 数据来源:互联网公开数据 标签:产品描述, 文本分析, 产品分类, 市场营销, 自然语言处理, 品牌分析, 机器翻译, 商业智能 数据概述:... -
英法双语翻译词句对照数据集English-FrenchTranslationPairs-bassant12mohamed
英法双语翻译词句对照数据集English-FrenchTranslationPairs-bassant12mohamed 数据来源:互联网公开数据 标签:机器翻译, 语言学习, 文本数据, 自然语言处理, 双语对照, 语料库, 英语, 法语 数据概述: 该数据集包含英法双语的词句对照数据,记录了英语单词或句子及其对应的法语翻译。主要特征如下:... -
数字彼得序列到序列文本生成数据集DigitalPeterSeq2SeqTextGenerationDataset-vitalygladyshev
数字彼得序列到序列文本生成数据集DigitalPeterSeq2SeqTextGenerationDataset-vitalygladyshev 数据来源:互联网公开数据 标签:序列到序列,文本生成,数据集,自然语言处理,深度学习,机器翻译,文本摘要,对话生成 数据概述:... -
多语言社交媒体评论情感分析数据集MultilingualSocialMediaCommentSentimentAnalysisDataset-harveenchadha
多语言社交媒体评论情感分析数据集MultilingualSocialMediaCommentSentimentAnalysisDataset-harveenchadha 数据来源:互联网公开数据 标签:情感分析, 文本分类, 多语言, 社交媒体, 评论, 数据标注, 机器翻译, 自然语言处理 数据概述:... -
多语言视觉问答图像数据集MultilingualVisualQuestionAnsweringImagesDataset-usmanmusa
多语言视觉问答图像数据集MultilingualVisualQuestionAnsweringImagesDataset-usmanmusa 数据来源:互联网公开数据 标签:视觉问答, 多语言, 图像识别, 机器翻译, 自然语言处理, 图像标注, 数据集, 跨模态 数据概述:...