找到44,288个数据集

标签: 机器学习

过滤结果
  • 合成大数据集异常检测

    2025年4月17日   

    合成大数据集异常检测 数据来源:互联网公开数据 标签:异常检测,合成数据,收入分析,职业信息,质量保证,数据清洗,机器学习,算法评估 数据概述:...
    packageimg
  • 合成引言数据集

    2025年4月15日   

    合成引言数据集 数据来源:互联网公开数据 标签:合成文本,机器学习,生成模型,自然语言处理,分类任务,引言生成,深度学习 数据概述: 本数据集包含用于生成分类任务的小型复杂数据集,适用于大语言模型(LLM)生成人类风格引言的研究和验证。数据集包括500条真实引言(490条训练,10条验证)以及通过mistral-...
    packageimg
  • 螃蟹年龄合成训练数据集

    2025年4月14日   

    螃蟹年龄合成训练数据集 数据来源:互联网公开数据 标签:螃蟹,年龄预测,合成数据,机器学习,训练集,特征工程,时间序列 数据概述: 本数据集是为 Playground Series Season3 Episode16 的训练任务额外提供的合成数据。数据由“Make Synthetic Crab Age...
    packageimg
  • 合成蟹类数据集

    2025年4月14日   

    合成蟹类数据集 数据来源:互联网公开数据 标签:合成数据,蟹类,平衡数据集,机器学习,数据竞赛 数据概述: 本数据集是由特定Notebook生成的合成蟹类数据,旨在提供一个平衡的数据集用于数据分析和机器学习竞赛。该数据集基于原始收集的数据生成,确保了类别之间的均衡分布,适用于各种分类和回归分析任务。 数据用途概述:...
    packageimg
  • 综合园艺维基数据集

    2025年4月14日   

    综合园艺维基数据集 数据来源:互联网公开数据 标签:园艺,维基,植物学,合成数据,语义分离,自然语言处理,测试数据,机器学习 数据概述: 本数据集是一个实验性的合成数据集,基于小型维基百科中关于园艺和植物学的条目集合。数据内容由Claude...
    packageimg
  • 带表情符号的推文数据集

    2025年4月15日   

    带表情符号的推文数据集 数据来源:互联网公开数据 标签:表情符号,推文,社交媒体,自然语言处理,情绪分析,文本挖掘,机器学习 数据概述:...
    packageimg
  • 文本标点符号校正数据集

    2025年7月26日   

    文本标点符号校正数据集_Text_Punctuation_Correction_Dataset 数据来源:互联网公开数据 标签:文本处理, 自然语言处理, 标点符号, 文本校正, 数据标注, 机器学习, 语料库, 文本分析 数据概述: 该数据集包含来自公开文本的数据,记录了用于文本标点符号校正的语料。主要特征如下:...
    packageimg
  • 工程符号数据集

    2025年4月15日   

    工程符号数据集 数据来源:互联网公开数据 标签:工程符号,图像识别,目标检测,机器学习,数据标注,PDF处理 数据概述: 本数据集包含近1000张标注并框选的图像,涉及少于250种工程符号。每种符号均经过三次旋转处理(分别对应北、南、东、西四个方向,其中北方向为原始方向),旨在提高模型的鲁棒性。 数据用途概述:...
    packageimg
  • 贝叶斯网络自然语言解释文本数据集

    2025年4月14日   

    贝叶斯网络自然语言解释文本数据集 数据来源:互联网公开数据 标签:贝叶斯网络,自然语言解释,可解释AI,文本分析,机器学习,语料库,语言学,解释生成 数据概述: 本数据集,即ExBAN语料库(Explanations for BAyesian...
    packageimg
  • 问答平台问题点赞数预测数据集

    2025年4月15日   

    问答平台问题点赞数预测数据集 数据来源:互联网公开数据 标签:问答平台,用户行为分析,点赞预测,机器学习,自然语言处理,声誉,用户互动,数据挖掘 数据概述:...
    packageimg
  • 电商平台用户流失预测数据集

    2025年4月14日   

    电商平台用户流失预测数据集 数据来源:互联网公开数据 标签:电商,用户流失,客户行为,预测分析,机器学习,客户细分,营销策略 数据概述: 本数据集包含了一个电商平台的用户信息,旨在分析和预测用户流失。数据包含5,630条用户记录,涵盖了20个特征,全面反映了用户的行为、偏好和参与度指标。 关键特征: CustomerID:每个用户的唯一标识符...
    packageimg
  • 电商平台商品数据集

    2025年4月15日   

    电商平台商品数据集 数据来源:互联网公开数据 标签:电商平台,商品信息,电商推荐系统,内容推荐,协同过滤,混合推荐,机器学习,数据标注 数据概述:...
    packageimg
  • 饮用水可饮用性预测数据集

    2025年4月15日   

    饮用水可饮用性预测数据集 数据来源:互联网公开数据 标签:水质分析,饮用水安全,污染检测,机器学习,预测模型,健康问题,可持续发展 数据概述:...
    packageimg
  • 宝可梦统计数据集

    2025年4月15日   

    宝可梦统计数据集 数据来源:互联网公开数据 标签:宝可梦,游戏数据,统计分析,机器学习,回归,分类,数据可视化,教育培训 数据概述: 本数据集包含41个字段和801行数据,涵盖了所有宝可梦的各项统计信息。数据集详细记录了宝可梦的名称、类型、生命值、攻击力、防御力、特殊攻击力、特殊防御力、速度等关键属性,适用于各种数据分析任务。 数据用途概述:...
    packageimg
  • 马尔可夫链模型数据集

    2025年4月14日   

    马尔可夫链模型数据集 数据来源:互联网公开数据 标签:马尔可夫链,概率模型,状态转移,随机过程,时间序列分析,预测建模,机器学习 数据概述:...
    packageimg
  • 梵语史诗摩诃婆罗多和罗摩衍那诗句英译数据集

    2025年4月15日   

    梵语史诗摩诃婆罗多和罗摩衍那诗句英译数据集 数据来源:互联网公开数据 标签:梵语, 史诗, 翻译, 语言学, 文本, 诗歌, 语料库, 机器学习, 文本生成 数据概述: 本数据集是一个梵语-英语翻译语料库,包含了从M. N....
    packageimg
  • 堆叠模型数据集

    2025年6月1日   

    堆叠模型数据集 数据来源:互联网公开数据 标签:堆叠模型,机器学习,特征工程,竞赛数据,Python代码,模型优化,验证准确率 数据概述: 本数据集包含当前竞赛中使用的7个堆叠模型及其相关数据文件。数据集包括以下内容: 1. 以Pickle格式存储的堆叠模型文件(7个模型)。 2. 经过特征工程处理后的train.csv和test.csv文件。 3....
    packageimg
  • 蛋白质折叠数据集

    2025年5月7日   

    蛋白质折叠数据集 数据来源:互联网公开数据 标签:蛋白质折叠,氨基酸,氢键,生物信息学,机器学习,结构预测,氨基酸序列,蛋白质结构 数据概述:...
    packageimg
  • 预测模型目标变量预测结果数据集

    2025年7月1日   

    预测模型目标变量预测结果数据集_Predictive_Model_Target_Variable_Prediction_Results 数据来源:互联网公开数据 标签:预测模型, 目标变量, 回归分析, 数据预测, 机器学习, 模型评估, 数据分析, 结果提交 数据概述: 该数据集包含一个预测模型的目标变量预测结果。主要特征如下:...
    packageimg
  • 四次多项式随机变量数据集

    2025年4月14日   

    四次多项式随机变量数据集 数据来源:互联网公开数据 标签:多项式回归,随机变量,噪声,数据分析,机器学习,统计建模 数据概述: 本数据集包含两个涉及随机变量及其噪声的四次多项式数据集。第一个数据集(dataset3.xlsx)由单一随机变量X生成,X遵循均值为0.25、标准差为7/12的正态分布。通过对X应用四次多项式P(x) = x + 2x^2 -...
    packageimg