-
文本增强语料数据集TextAugmentationCorpus-fareedmohamed
文本增强语料数据集TextAugmentationCorpus-fareedmohamed 数据来源:互联网公开数据 标签:文本增强, 数据增强, 自然语言处理, 文本生成, 机器学习, 噪声注入, 文本处理, 语料库 数据概述: 该数据集包含经过文本增强处理的语料,记录了原始文本及其对应的增强版本,主要用于训练和评估文本增强模型。主要特征如下:... -
孟加拉语-英语语言分类合成权重数据集-nazmuddhohaansary
孟加拉语-英语语言分类合成权重数据集-nazmuddhohaansary 数据来源:互联网公开数据 标签:语言分类,数据集,机器学习,文本处理,自然语言处理,孟加拉语,英语,合成数据 数据概述: 该数据集包含了用于孟加拉语和英语语言分类任务的合成数据,旨在评估和训练语言识别模型。主要特征如下:... -
代码自动补全Python代码数据集CodeAutocompletionPythonCodeDataset-aidarkhuzin1
代码自动补全Python代码数据集CodeAutocompletionPythonCodeDataset-aidarkhuzin1 数据来源:互联网公开数据 标签:代码补全, Python, 机器学习, 代码生成, 编程语言, 深度学习, 文本处理, 数据集 数据概述:... -
文档分类数据集PhanLoaiVanBanDataset-beosup
文档分类数据集PhanLoaiVanBanDataset-beosup 数据来源:互联网公开数据 标签:文档分类,数据集,文本分析,机器学习,自然语言处理,信息检索,分类算法,文本处理 数据概述: 该数据集包含来自多个来源的文档数据,记录了不同类型的文本内容及其分类标签。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
文本分类与情感分析数据集CLEFDataSplitDataset-hwigeon
文本分类与情感分析数据集CLEFDataSplitDataset-hwigeon 数据来源:互联网公开数据 标签:文本分类,情感分析,数据集,自然语言处理,机器学习,数据挖掘,文本处理,人工智能 数据概述: 该数据集来源于CLEF(会议与实验论坛)项目,主要包含用于文本分类和情感分析任务的文本数据。主要特征如下:... -
商品评论文本摘要数据集ProductReviewTextSummarization-allenye66
商品评论文本摘要数据集ProductReviewTextSummarization-allenye66 数据来源:互联网公开数据 标签:文本摘要, 情感分析, 商品评论, 自然语言处理, 文本处理, 机器翻译, 数据清洗, 深度学习 数据概述:... -
文本毒性对比分析数据集TextToxicityComparisonAnalysisDataset-aronbryant
文本毒性对比分析数据集TextToxicityComparisonAnalysisDataset-aronbryant 数据来源:互联网公开数据 标签:文本分析, 毒性检测, 情感分析, 负面情绪, 文本处理, 机器学习, 语料库, 对比分析 数据概述: 该数据集包含来自互联网的文本数据,记录了不同文本的毒性程度对比。主要特征如下:... -
商品描述文本处理数据集ProductDescriptionTextProcessingDataset-aayush895
商品描述文本处理数据集ProductDescriptionTextProcessingDataset-aayush895 数据来源:互联网公开数据 标签:商品描述, 文本处理, 文本分析, 商品分类, 自然语言处理, 零售, 机器学习, 数据清洗 数据概述: 该数据集包含来自电商平台的商品描述信息,记录了不同商品的详细文本描述。主要特征如下:... -
HTML代码规范纠正数据集HTMLCodeStandardizationCorrection-kartik1045
HTML代码规范纠正数据集HTMLCodeStandardizationCorrection-kartik1045 数据来源:互联网公开数据 标签:HTML, 代码规范, 文本处理, 数据清洗, 网页开发, 编程实践, 错误修复, 代码校正 数据概述: 该数据集包含HTML代码片段,记录了不符合规范的HTML代码及其对应的规范代码。主要特征如下:... -
Spotify音乐特征分析数据集SpotifyMusicFeatureAnalysis-henrydalrymple
Spotify音乐特征分析数据集SpotifyMusicFeatureAnalysis-henrydalrymple 数据来源:互联网公开数据 标签:音乐分析, 音乐特征, Spotify, 机器学习, 音频分析, 歌曲推荐, 数据挖掘, 文本处理 数据概述:... -
图像标注实体数值预测数据集ImageAnnotationEntityValuePrediction-dravikumar
图像标注实体数值预测数据集ImageAnnotationEntityValuePrediction-dravikumar 数据来源:互联网公开数据 标签:图像识别, 实体标注, 数值预测, 机器学习, 计算机视觉, 数据分析, 文本处理, 度量单位 数据概述:... -
音乐歌词与MIDI文件数据集MusicLyricsandMIDIFilesDataset-kerensteinberg
音乐歌词与MIDI文件数据集MusicLyricsandMIDIFilesDataset-kerensteinberg 数据来源:互联网公开数据 标签:歌词分析, MIDI音乐, 音乐创作, 文本处理, 音乐数据, 自然语言处理, 音乐检索, 机器学习 数据概述: 该数据集包含音乐歌词文本和对应的MIDI音乐文件。主要特征如下:... -
代码安全漏洞检测PHP代码片段数据集CodeSecurityVulnerabilityDetectionPHPCodeSnippets-youssefha...
代码安全漏洞检测PHP代码片段数据集CodeSecurityVulnerabilityDetectionPHPCodeSnippets-youssefhazemfarouk 数据来源:互联网公开数据 标签:代码安全, 漏洞检测, PHP, 静态分析, 文本处理, 安全审计, 机器学习, 恶意代码 数据概述:... -
文本情感分析多模态数据集MultimodalTextSentimentAnalysisDataset-giorgiorossi
文本情感分析多模态数据集MultimodalTextSentimentAnalysisDataset-giorgiorossi 数据来源:互联网公开数据 标签:情感分析, 文本处理, 多模态, 自然语言处理, 机器学习, 情感分类, 文本特征, Spacy 数据概述:... -
法律判决摘要匿名化数据集LegalJudgmentSummaryAnonymizationDataset-thejasrao
法律判决摘要匿名化数据集LegalJudgmentSummaryAnonymizationDataset-thejasrao 数据来源:互联网公开数据 标签:法律, 判决, 摘要, 匿名化, 自然语言处理, 文本处理, 数据清洗, 信息安全 数据概述:... -
越南法律问答数据集VietnamLegalQuestionAnsweringDataset-cuong1702
越南法律问答数据集VietnamLegalQuestionAnsweringDataset-cuong1702 数据来源:互联网公开数据 标签:法律问答, 自然语言处理, 问答系统, 文本处理, 越南语, 信息检索, 机器学习, 法律法规 数据概述: 该数据集包含来自越南法律领域的问题和答案,旨在用于构建和评估法律问答系统。主要特征如下:... -
jigswig多语言IPA音译毒评分类数据集-davidbnn92
jigswig多语言IPA音译毒评分类数据集-davidbnn92 数据来源:互联网公开数据 标签:Jigsaw,多语言,毒评分类,IPA,音译,文本处理,数据集,机器学习 数据概述:... -
电影票房与特征分析数据集MovieRevenueandFeatureAnalysisDataset-adktyakirloskar
电影票房与特征分析数据集MovieRevenueandFeatureAnalysisDataset-adktyakirloskar 数据来源:互联网公开数据 标签:电影, 票房, 电影产业, 电影特征, 数据分析, 机器学习, 文本处理, 市场预测 数据概述: 该数据集包含来自TMDB(The Movie... -
新闻文章分类数据集
新闻文章分类数据集 数据来源:互联网公开数据 标签:新闻分类,文本处理,机器学习,自然语言处理,数据标注,文本分析,分类算法 数据概述: 本数据集包含新闻文章的文本内容及其对应的分类标签,旨在支持文本分类任务的研究与实践。数据集分为训练文件和测试文件两部分。训练文件包含三列:文章内容(Article... -
时间日期格式转换数据集TimeDateFormatConversion-chenxuanying
时间日期格式转换数据集TimeDateFormatConversion-chenxuanying 数据来源:互联网公开数据 标签:时间序列, 日期转换, 自然语言处理, 数据清洗, 文本处理, 机器学习, 深度学习, 格式识别 数据概述: 该数据集包含来自开源项目的数据,记录了用于训练和评估时间日期格式转换模型的数据。主要特征如下:...