-
文本摘要语料库预处理数据集TextSummarizationCorpusPreprocessed-anandheeanand
文本摘要语料库预处理数据集TextSummarizationCorpusPreprocessed-anandheeanand 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 语料库, 预处理, 文本分析, 词嵌入, 机器学习, 文本挖掘 数据概述: 该数据集包含经过预处理的文本数据,旨在为文本摘要任务提供训练素材。主要特征如下:... -
大型语言模型新筛选数据集LLMNewFilteredDataset-ashkankhademian
大型语言模型新筛选数据集LLMNewFilteredDataset-ashkankhademian 数据来源:互联网公开数据 标签:人工智能,自然语言处理,数据集,机器学习,语言模型,文本分析,深度学习,模型训练 数据概述: 该数据集包含经过筛选的大型语言模型(LLM)训练数据,记录了用于优化和训练语言模型的文本内容。主要特征如下:... -
叙利亚冲突新闻摘要分析数据集SyriaConflictNewsSummaryAnalysis-ipaini
叙利亚冲突新闻摘要分析数据集SyriaConflictNewsSummaryAnalysis-ipaini 数据来源:互联网公开数据 标签:新闻摘要, 文本分析, 叙利亚冲突, 自然语言处理, 政治评论, 事件分析, 机器学习, 舆情分析 数据概述: 该数据集包含来自新闻报道的叙利亚冲突相关文章,记录了文章主体内容及其摘要。主要特征如下:... -
英语到印地语翻译数据集-amnydv17
英语到印地语翻译数据集-amnydv17 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,语言学,英语,印地语,文本翻译,深度学习 数据概述: 该数据集包含了大量的英语到印地语的翻译文本对,旨在用于机器翻译模型的训练和评估。主要特征如下: 时间跨度:数据集的构建时间跨度不固定,持续更新和扩展。... -
越南语文本分类数据集VietnameseTextClassificationDataset-mrcausallll
越南语文本分类数据集VietnameseTextClassificationDataset-mrcausallll 数据来源:互联网公开数据 标签:文本分类, 越南语, 自然语言处理, 语料库, 商业, 行政, 文本清洗, 机器学习 数据概述: 该数据集包含来自越南语文本的数据,记录了越南语文本及其对应的类别标签。主要特征如下:... -
商品标题文本分类数据集ProductTitleTextClassificationDataset-its4iris
商品标题文本分类数据集ProductTitleTextClassificationDataset-its4iris 数据来源:互联网公开数据 标签:商品标题, 文本分类, 商品信息, 自然语言处理, 机器学习, 数据清洗, 标题生成, 产品识别 数据概述:... -
虚假新闻文本分析数据集FakeNewsTextAnalysisDataset-shwe1308
虚假新闻文本分析数据集FakeNewsTextAnalysisDataset-shwe1308 数据来源:互联网公开数据 标签:虚假新闻, 文本分析, 新闻分类, 自然语言处理, 情感分析, 机器学习, 舆情分析, 数据清洗 数据概述:... -
医学影像报告诊断数据集MIDRCRICORD-600-lunar123
医学影像报告诊断数据集MIDRCRICORD-600-lunar123 数据来源:互联网公开数据 标签:医学影像,放射学,自然语言处理,数据集,文本分析,疾病诊断,临床研究,人工智能 数据概述: 该数据集来自医学影像数据资源中心(MIDRC),是RICORD-600项目的公开数据集,包含医学影像报告及其对应的诊断结果。主要特征如下:... -
新闻摘要文本分析数据集NewsSummaryTextAnalysis-terrychanorg
新闻摘要文本分析数据集NewsSummaryTextAnalysis-terrychanorg 数据来源:互联网公开数据 标签:新闻摘要, 文本分析, 自然语言处理, 文本摘要, 关键词提取, 语义分析, 机器翻译, 数据标注 数据概述:... -
AI代码生成与解析数据集AI4CodeCrawledDevDataset-yufuin
AI代码生成与解析数据集AI4CodeCrawledDevDataset-yufuin 数据来源:互联网公开数据 标签:人工智能,代码生成,数据集,机器学习,自然语言处理,软件开发,算法研究,编程辅助 数据概述: 该数据集由AI4Code项目提供,主要记录了代码生成与解析相关的数据,适用于代码自动生成、代码理解及编程辅助工具的开发。主要特征如下:... -
图像描述生成与评估数据集EvaluationBLIPFlicker8kDataset-salehelhawaryy
图像描述生成与评估数据集EvaluationBLIPFlicker8kDataset-salehelhawaryy 数据来源:互联网公开数据 标签:图像处理,自然语言处理,数据集,机器学习,视觉描述,深度学习,计算机视觉,人工智能 数据概述: 该数据集由 BLIP 模型在 Flicker8k... -
评论社区内容毒性评估数据集CommunityContentToxicityEvaluation-httpwwwfszyc
评论社区内容毒性评估数据集CommunityContentToxicityEvaluation-httpwwwfszyc 数据来源:互联网公开数据 标签:毒性检测, 文本分类, 情感分析, 社交媒体, 机器学习, 标注数据, 自然语言处理, 社区互动 数据概述: 该数据集包含来自评论社区的文本数据,记录了对评论内容毒性的评估结果。主要特征如下:... -
写作质量特征工程数据集-mcpenguin
写作质量特征工程数据集-mcpenguin 数据来源:互联网公开数据 标签:写作质量,特征工程,自然语言处理,数据集,文本分析,机器学习,语言模型,内容评估 数据概述: 该数据集包含了经过特征工程处理的文本数据,旨在用于评估和预测文本的写作质量。主要特征如下: 时间跨度: 数据集未明确标注时间跨度,但数据来源于不同时间段的文本内容。 地理范围:... -
图像描述生成数据集ImageCaptioningDataset-zainpirzada68
图像描述生成数据集ImageCaptioningDataset-zainpirzada68 数据来源:互联网公开数据 标签:图像描述, 计算机视觉, 自然语言处理, 图像标注, 深度学习, 图像识别, 数据集, 文本生成 数据概述: 该数据集包含图像文件及其对应的文字描述,用于训练和评估图像描述生成模型。主要特征如下:... -
多语言问答文本数据集MultilingualQuestionAnsweringTextDataset-zacchaeus
多语言问答文本数据集MultilingualQuestionAnsweringTextDataset-zacchaeus 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本理解, 阅读理解, 机器阅读, 多语言, 文本标注, 数据集 数据概述: 该数据集包含来自多个来源的问答文本数据,旨在用于评估和训练多语言问答系统。主要特征如下:... -
俄语新闻摘要生成数据集RussianNewsSummarizationDataset-anatoliypan
俄语新闻摘要生成数据集RussianNewsSummarizationDataset-anatoliypan 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 俄语, 新闻分析, 机器翻译, 深度学习, 文本生成, 语料库 数据概述: 该数据集包含来自新闻文章的数据,记录了俄语新闻文章的标题、原文文本及其生成的摘要。主要特征如下:... -
英文语音合成数据集EnglishSpeechSynthesisDataset-nirmanor1
英文语音合成数据集EnglishSpeechSynthesisDataset-nirmanor1 数据来源:互联网公开数据 标签:语音合成, 文本转语音, 语音识别, 自然语言处理, 音频数据, LJSpeech, 数据集, 深度学习 数据概述:... -
电影评论情感分析数据集MovieReviewSentimentAnalysis-pulkittarora
电影评论情感分析数据集MovieReviewSentimentAnalysis-pulkittarora 数据来源:互联网公开数据 标签:情感分析, 文本分类, 电影评论, 自然语言处理, 情感极性, 机器学习, 数据标注, 语料库 数据概述: 该数据集包含来自互联网的电影评论文本,记录了每条评论对应的情感极性标签。主要特征如下:... -
电影评论情感分析数据集MovieReviewSentimentAnalysis-davideaguglia
电影评论情感分析数据集MovieReviewSentimentAnalysis-davideaguglia 数据来源:互联网公开数据 标签:情感分析, 文本挖掘, 自然语言处理, 电影评论, 情感分类, 数据标注, 机器学习, 语料库 数据概述: 该数据集包含电影评论数据,记录了观众对电影的情感反馈。主要特征如下:... -
交通出行文本情感分析数据集TransportationTextSentimentAnalysis-tabualkher
交通出行文本情感分析数据集TransportationTextSentimentAnalysis-tabualkher 数据来源:互联网公开数据 标签:文本情感分析, 交通出行, 语料库, 情感分类, 机器学习, 自然语言处理, 交通政策, 环境保护 数据概述:...