-
诗歌文本摘要生成训练数据集PoetryTextSummarizationTrainingDataset-lehoangnam
诗歌文本摘要生成训练数据集PoetryTextSummarizationTrainingDataset-lehoangnam 数据来源:互联网公开数据 标签:诗歌, 文本摘要, 自然语言处理, 诗歌分析, 文本生成, 诗歌创作, 机器翻译, 数据集 数据概述:... -
孟加拉语情感分析文本数据集BanglaSentimentAnalysisTextDataset-milonsheikh
孟加拉语情感分析文本数据集BanglaSentimentAnalysisTextDataset-milonsheikh 数据来源:互联网公开数据 标签:情感分析, 孟加拉语, 文本分类, 情绪识别, 自然语言处理, 数据标注, 情感词典, 机器翻译 数据概述: 该数据集包含孟加拉语文本,并标注了对应的情感类别。主要特征如下:... -
交通法规翻译对照数据集TrafficLawTranslationDataset-amejamie
交通法规翻译对照数据集TrafficLawTranslationDataset-amejamie 数据来源:互联网公开数据 标签:交通法规, 翻译, 文本翻译, 机器翻译, 法律文本, 对照分析, 多语言, 数据挖掘 数据概述: 该数据集包含来自多个国家或地区的交通法规文本及其对应的翻译版本,旨在提供交通法规的原文与翻译对照。主要特征如下:... -
自然语言处理文本编码数据集NaturalLanguageProcessingTextEncodingDataset-linshokaku
自然语言处理文本编码数据集NaturalLanguageProcessingTextEncodingDataset-linshokaku 数据来源:互联网公开数据 标签:自然语言处理, 文本编码, 深度学习, 预训练模型, 机器翻译, 文本分类, 序列建模, 数据集 数据概述: 该数据集包含用于训练和评估自然语言处理模型的文本编码数据。主要特征如下:... -
多语言文本相似度评估训练数据集MultilingualTextSimilarityEvaluationTrainingDataset-rookiejing
多语言文本相似度评估训练数据集MultilingualTextSimilarityEvaluationTrainingDataset-rookiejing 数据来源:互联网公开数据 标签:文本相似度, 多语言, 机器翻译, 自然语言处理, 文本匹配, 语料库, 深度学习, 语义分析 数据概述:... -
CNN和每日邮报新闻摘要增强数据集CNN-DailyMailNewsSummaryAugmentedDataset-lachonman2
CNN和每日邮报新闻摘要增强数据集CNN-DailyMailNewsSummaryAugmentedDataset-lachonman2 数据来源:互联网公开数据 标签:新闻摘要,文本摘要,自然语言处理,深度学习,数据集,文本分析,机器翻译,语言模型 数据概述: 该数据集源自CNN和每日邮报(Daily... -
对话摘要生成任务数据集DialogueSummarizationTaskDataset-zeyneplda
对话摘要生成任务数据集DialogueSummarizationTaskDataset-zeyneplda 数据来源:互联网公开数据 标签:对话摘要, 文本生成, 自然语言处理, 对话分析, 机器翻译, 深度学习, 文本摘要, 语料库 数据概述: 该数据集包含对话文本及其对应的摘要信息,旨在用于对话摘要生成任务。主要特征如下:... -
对话摘要生成模型效果评估数据集DialogueSummaryGenerationModelEvaluation-somitmukherjee
对话摘要生成模型效果评估数据集DialogueSummaryGenerationModelEvaluation-somitmukherjee 数据来源:互联网公开数据 标签:对话摘要, 自然语言处理, 文本生成, 模型评估, 对话系统, 机器翻译, 摘要生成, 深度学习 数据概述:... -
印地语-英语平行语料库数据集Hindi-EnglishParallelCorpus-saumyamishra536
印地语-英语平行语料库数据集Hindi-EnglishParallelCorpus-saumyamishra536 数据来源:互联网公开数据 标签:机器翻译, 文本对齐, 语言模型, 印度语言, 语料库, 自然语言处理, 双语数据, 英语 数据概述: 该数据集包含来自互联网的印地语-... -
多语言文本分类训练数据集MultilingualTextClassificationTrainingDataset-jvkchaitanya410
多语言文本分类训练数据集MultilingualTextClassificationTrainingDataset-jvkchaitanya410 数据来源:互联网公开数据 标签:文本分类, 多语言, 机器翻译, 语言识别, 自然语言处理, 语料库, 文本挖掘, 数据标注 数据概述:... -
英文文本释义生成平行语料数据集EnglishTextParaphraseCorpus-trid4012
英文文本释义生成平行语料数据集EnglishTextParaphraseCorpus-trid4012 数据来源:互联网公开数据 标签:文本释义, 自然语言处理, 语料库, 文本生成, 语义理解, 机器翻译, 数据集, 深度学习 数据概述: 该数据集包含英文文本及其释义的平行语料,旨在支持文本释义生成、语义理解和机器翻译等任务。主要特征如下:... -
多语言恶意评论翻译数据集MultilingualToxicCommentTranslationDataset-sandiago21
多语言恶意评论翻译数据集MultilingualToxicCommentTranslationDataset-sandiago21 数据来源:互联网公开数据 标签:多语言, 文本翻译, 恶意评论, 自然语言处理, 机器翻译, 文本分析, 语料库, Jigsaw 数据概述:... -
葡萄牙语新闻摘要数据集PortugueseNewsSummaryDataset-raquelclementesilva
葡萄牙语新闻摘要数据集PortugueseNewsSummaryDataset-raquelclementesilva 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,葡萄牙语,数据集,深度学习,NLP,新闻,机器翻译 数据概述: 该数据集包含葡萄牙语新闻文章及其对应的摘要,旨在用于文本摘要任务。主要特征如下:... -
跨语言视觉问答数据集Cross-lingualVisualQuestionAnsweringDataset-alhajiidibabate
跨语言视觉问答数据集Cross-lingualVisualQuestionAnsweringDataset-alhajiidibabate 数据来源:互联网公开数据 标签:视觉问答, 跨语言, 图像识别, 自然语言处理, 机器翻译, 图像检索, Hausa语, 英语 数据概述:... -
斯瓦希里语语料库数据集-kariukiandrew
斯瓦希里语语料库数据集-kariukiandrew 数据来源:互联网公开数据 标签:斯瓦希里语,语料库,自然语言处理,文本分析,语言学,机器翻译,文本挖掘,非洲语言 数据概述: 该数据集包含斯瓦希里语文本语料,旨在为自然语言处理和语言学研究提供资源。主要特征如下: 时间跨度:数据涵盖不同时期和来源的斯瓦希里语文本。... -
孟加拉语文本翻译数据集BengaliTextTranslationDataset-vihaanagrawal
孟加拉语文本翻译数据集BengaliTextTranslationDataset-vihaanagrawal 数据来源:互联网公开数据 标签:机器翻译, 文本分析, 孟加拉语, 语言学, 自然语言处理, 语料库, 文本预处理, 语言模型 数据概述: 该数据集包含来自互联网的孟加拉语文本片段,记录了用于机器翻译训练的孟加拉语文本。主要特征如下:... -
产品组装SOP中越双语对照数据集ProductAssemblySOPChinese-VietnameseBilingualDataset-phamanhtu495
产品组装SOP中越双语对照数据集ProductAssemblySOPChinese-VietnameseBilingualDataset-phamanhtu495 数据来源:互联网公开数据 标签:双语对照, 机器翻译, 文本翻译, 产品组装, SOP, 越南语, 中文, 制造业 数据概述:... -
法律文书摘要生成与评估数据集LegalDocumentAbstractiveSummarizationandEvaluationDataset-veerchheda11
法律文书摘要生成与评估数据集LegalDocumentAbstractiveSummarizationandEvaluationDataset-veerchheda11 数据来源:互联网公开数据 标签:文本摘要, 法律文书, 自然语言处理, 摘要评估, Rouge指标, 文本生成, 司法案例, 机器翻译 数据概述:... -
多语言平行文本相似度评估数据集MultilingualParallelTextSimilarityEvaluationDataset-rookiejing
多语言平行文本相似度评估数据集MultilingualParallelTextSimilarityEvaluationDataset-rookiejing 数据来源:互联网公开数据 标签:平行语料, 文本相似度, 机器翻译, 多语言, 文本匹配, 西班牙语, 英语, 阿拉伯语, 豪萨语, 机器学习 数据概述:... -
中文新闻摘要生成数据集ChineseNewsSummarizationDataset-spiritwalk
中文新闻摘要生成数据集ChineseNewsSummarizationDataset-spiritwalk 数据来源:互联网公开数据 标签:新闻摘要, 文本生成, 自然语言处理, 机器翻译, 文本摘要, 中文文本, 深度学习, 数据集 数据概述: 该数据集包含来自中国新闻媒体的文章及其对应的摘要,旨在用于训练和评估中文文本摘要模型。主要特征如下:...