找到12,522个数据集

标签: TXT

过滤结果
  • 聚类算法数据集ClusteringDatasets-ahmedmohameddawoud

    2025年4月24日   

    聚类算法数据集ClusteringDatasets-ahmedmohameddawoud 数据来源:互联网公开数据 标签:聚类,数据集,机器学习,无监督学习,数据挖掘,模式识别,算法评估,数据分析 数据概述: 该数据集包含了多种用于聚类算法测试和评估的数据集,涵盖了不同的数据分布,维度和规模。主要特征如下: 时间跨度:...
    packageimg
  • 板球比赛文本数据集CricinfoTextDataset-nitinkumarbairwa

    2025年4月24日   

    板球比赛文本数据集CricinfoTextDataset-nitinkumarbairwa 数据来源:互联网公开数据 标签:板球,体育,数据集,文本分析,机器学习,自然语言处理,体育新闻,赛事报道 数据概述: 该数据集包含来自Cricinfo网站的比赛文本数据,记录了板球比赛的相关信息。主要特征如下:...
    packageimg
  • 恶意网址数据集OpenPhish恶意网址数据集-shantanu199

    2025年4月24日   

    恶意网址数据集OpenPhish恶意网址数据集-shantanu199 数据来源:互联网公开数据 标签:网络安全,恶意网址,威胁情报,数据集,网络钓鱼,URL分析,机器学习,安全研究 数据概述: 该数据集由 OpenPhish 收集,包含了大量的恶意网址信息,用于网络安全研究和恶意网址检测。主要特征如下:...
    packageimg
  • 绝命毒师情景喜剧数据集BreakingBadSitcomDataset-shilpibhattacharyya

    2025年4月24日   

    绝命毒师情景喜剧数据集BreakingBadSitcomDataset-shilpibhattacharyya 数据来源:互联网公开数据 标签:情景喜剧,电视剧,数据集,文本分析,角色互动,剧本分析,自然语言处理,文化研究 数据概述: 该数据集包含了电视剧《绝命毒师》的情景喜剧相关数据,记录了剧集中对话,场景和角色互动等信息。主要特征如下: 时间跨度:...
    packageimg
  • 样本训练数据集-ahmedmohammed244

    2025年4月24日   

    样本训练数据集-ahmedmohammed244 数据来源:互联网公开数据 标签:机器学习,训练数据,数据集,模型构建,数据预处理,数据分析,人工智能,自然语言处理 数据概述: 该数据集包含用于机器学习模型训练的样本数据,记录了多种类型的样本信息。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于样本的产生时间。...
    packageimg
  • 土耳其邮件垃圾邮件数据集TurkishMailSpamDataset-alpersah11

    2025年4月24日   

    土耳其邮件垃圾邮件数据集TurkishMailSpamDataset-alpersah11 数据来源:互联网公开数据 标签:垃圾邮件,电子邮件,文本分析,自然语言处理,机器学习,土耳其语,文本分类,网络安全 数据概述: 该数据集包含了土耳其语的电子邮件数据,用于垃圾邮件检测和分类。主要特征如下:...
    packageimg
  • DARPA原始数据集DARPAOriginalDataset-dikshashri13702

    2025年4月24日   

    DARPA原始数据集DARPAOriginalDataset-dikshashri13702 数据来源:互联网公开数据 标签:网络安全,数据集,入侵检测,机器学习,异常检测,防御系统,信号处理,网络攻防 数据概述: 该数据集来源于DARPA(美国国防高级研究计划局)提供的原始网络数据,记录了网络攻击和正常网络流量的详细信息。主要特征如下:...
    packageimg
  • 卡纳达语情感分析数据集-kishorsinnur

    2025年4月24日   

    卡纳达语情感分析数据集-kishorsinnur 数据来源:互联网公开数据 标签:情感分析,卡纳达语,自然语言处理,数据集,文本分类,机器学习,印度语言,语言学 数据概述:该数据集包含来自各种来源的卡纳达语文本数据,用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,但包含了从近期到过去一段时间的文本数据。...
    packageimg
  • 化合物分子结构数据集SMILES-yusaku5739

    2025年4月24日   

    化合物分子结构数据集SMILES-yusaku5739 数据来源:互联网公开数据 标签:化学,数据集,分子结构,SMILES,机器学习,化学信息学,药物发现,分子建模 数据概述:该数据集包含化合物的SMILES(Simplified Molecular Input Line Entry System)字符串,记录了各种化学分子的结构信息。主要特征如下:...
    packageimg
  • 质量控制语料库数据集QCCorpusDataset-ashokurlana

    2025年4月24日   

    质量控制语料库数据集QCCorpusDataset-ashokurlana 数据来源:互联网公开数据 标签:质量控制,语料库,数据集,自然语言处理,文本分析,机器学习,语言技术,数据标注 数据概述:该数据集包含来自质量控制领域的语料数据,记录了与质量控制相关的文本内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • 歌曲歌词情感分析数据集DeadLyrics5Dataset-alexbaylis

    2025年4月24日   

    歌曲歌词情感分析数据集DeadLyrics5Dataset-alexbaylis 数据来源:互联网公开数据 标签:歌词,情感分析,自然语言处理,音乐,数据集,文本挖掘,机器学习,情感分类 数据概述:该数据集包含来自互联网的歌曲歌词数据,旨在用于情感分析和文本挖掘任务。主要特征如下: 时间跨度:数据记录的时间范围不详,但涵盖了不同年代和风格的歌曲。...
    packageimg
  • 光学字符识别文本块数据集OCRChunksDataset-harshithasudhakar

    2025年4月24日   

    光学字符识别文本块数据集OCRChunksDataset-harshithasudhakar 数据来源:互联网公开数据 标签:OCR,文本识别,数据集,图像处理,自然语言处理,计算机视觉,深度学习,文本分析 数据概述:该数据集包含从各种文档和图像中提取的文本块数据,用于光学字符识别(OCR)技术的训练和评估。主要特征如下:...
    packageimg
  • 国际数学奥林匹克竞赛IMO试题数据集-shaunshibu

    2025年4月24日   

    国际数学奥林匹克竞赛IMO试题数据集-shaunshibu 数据来源:互联网公开数据 标签:数学竞赛,奥林匹克,试题,数据集,数学教育,问题求解,学术研究,竞赛分析 数据概述: 该数据集包含了国际数学奥林匹克竞赛(IMO)的试题,解答和相关信息。主要特征如下: 时间跨度:数据记录的时间范围涵盖了自IMO创办以来的历年试题,从早期到近期。...
    packageimg
  • YouTube视频评论垃圾邮件识别数据集YouTubeSpam-NotSpamDataset-madhuragl

    2025年4月24日   

    YouTube视频评论垃圾邮件识别数据集YouTubeSpam-NotSpamDataset-madhuragl 数据来源:互联网公开数据 标签:垃圾邮件,YouTube,评论,文本分析,自然语言处理,机器学习,情感分析,数据挖掘 数据概述: 该数据集包含来自YouTube视频的评论数据,用于识别垃圾邮件评论。主要特征如下:...
    packageimg
  • 博客文章内容分析数据集BlogsDataset-subhranilmondal12

    2025年4月24日   

    博客文章内容分析数据集BlogsDataset-subhranilmondal12 数据来源:互联网公开数据 标签:博客,文本分析,自然语言处理,情感分析,社交媒体,数据集,内容挖掘,主题建模 数据概述: 该数据集包含了来自多个博客平台的大量文章内容,记录了不同作者撰写的博客文章。主要特征如下:...
    packageimg
  • 垃圾邮件与非垃圾邮件分类数据集Spam-HamEmailsClassificationDataset-rockinjas123

    2025年4月24日   

    垃圾邮件与非垃圾邮件分类数据集Spam-HamEmailsClassificationDataset-rockinjas123 数据来源:互联网公开数据 标签:邮件分类,数据集,垃圾邮件检测,自然语言处理,机器学习,文本分析,信息安全,数据挖掘 数据概述:...
    packageimg
  • 全球气候变暖异常数据GlobalWarmingAnomaliesDataset-jayantdon

    2025年4月24日   

    全球气候变暖异常数据GlobalWarmingAnomaliesDataset-jayantdon 数据来源:互联网公开数据 标签:气候变化,全球变暖,温度异常,数据集,气象学,环境科学,时间序列分析,数据可视化 数据概述: 该数据集包含全球气候变暖相关的温度异常数据,记录了全球不同地区的气温变化情况。主要特征如下:...
    packageimg
  • 小行星撞击威胁数据AsteroidCollisionThreatData-devanik

    2025年4月24日   

    小行星撞击威胁数据AsteroidCollisionThreatData-devanik 数据来源:互联网公开数据 标签:小行星,撞击,威胁,地球,天文学,数据集,风险评估,行星防御 数据概述: 该数据集包含有关小行星撞击地球威胁的数据,记录了潜在危险小行星的详细信息。主要特征如下: 时间跨度:数据记录的时间范围涵盖了从历史观测至今的时期。...
    packageimg
  • 国际象棋开局数据集ECO编码-louispetrik

    2025年4月24日   

    国际象棋开局数据集ECO编码-louispetrik 数据来源:互联网公开数据 标签:国际象棋,开局,数据集,ECO编码,博弈论,策略分析,机器学习,游戏分析 数据概述: 该数据集包含国际象棋开局的详细信息,基于ECO编码进行组织和分类。主要特征如下: 时间跨度:数据记录的时间范围涵盖了国际象棋历史上的重要开局和变体。...
    packageimg
  • 亚马逊OCR数据集AmazonOCRDataset-sivashanks

    2025年4月24日   

    亚马逊OCR数据集AmazonOCRDataset-sivashanks 数据来源:互联网公开数据 标签:光学字符识别,OCR,数据集,图像处理,深度学习,文本识别,亚马逊,计算机视觉 数据概述: 该数据集包含来自亚马逊的OCR(光学字符识别)数据,主要用于训练和评估OCR模型的性能。主要特征如下:...
    packageimg