找到96,107个数据集

过滤结果
  • 全球商品与服务出口:按国家、收入群体和地区划分的商品和服务出口(1960 -2025)

    2025年2月17日 387 15 2

    该数据集提供了 1960 年至今世界各国商品和服务出口占 GDP 百分比的历史数据。它包含按国家、收入群体和地区分类的信息,对经济分析、贸易研究和政策研究很有价值。该文件包含 1960 年至今每个国家商品和服务出口占 GDP 百分比的年度数据。其中包括国家名称、ISO 代码、经济区域和收入分类等基本详细信息。 数据来源...
    packageimg
  • 陨石着陆地球数据:全球 34,500 多颗陨石着陆的详细记录

    2025年2月17日 300 27 6

    该数据集包含全球 34,513 颗已知陨石着陆的详细记录,由陨石学会汇编并托管在 NASA 的开放数据门户上。它包括有关陨石的基本信息,例如其分类、质量、位置以及它们是被观察到坠落还是后来被发现。 数据集概述 数据集由以下主要列组成: 名称——陨石的正式名称。 id – 每颗陨石的唯一标识符。 nametype – 指示陨石是否: 有效:大多数陨石...
    packageimg
  • IMDb电影元数据的集合,包括评级、评论、类型和运行时间

    2025年2月17日 200 13 5

    该数据集包含 IMDb 电影元数据,包括电影名称、上映年份、年龄分级、类型和用户评分。它为数据分析、机器学习和推荐系统提供了宝贵的见解。 name - 电影名称 year - 电影上映年份 movie_rated - 官方年龄分级 run_length - 电影时长(分钟) types - 与电影相关的类型 release_date -...
    packageimg
  • 2024 年全球最幸福国家排名(基于幸福指数)

    2025年2月17日 160 29 5

    该数据集包含 2024 年全球最幸福国家排名,数据来源于《世界人口评论》。排名基于各种幸福指标,例如收入、社会支持、预期寿命、生活选择自由、慷慨程度和对腐败的看法。数据反映了 2024 年各国幸福指数的全球排名,深入了解了影响国家幸福的因素。
    packageimg
  • 跟踪睡眠习惯并分析其对生产力的影响

    2025年2月17日 150 10 9

    睡眠周期和生产力数据集概述 该数据集追踪睡眠习惯及其对生产力、情绪和压力水平的影响。它包含5000 条记录,涵盖不同年龄和生活方式的多个个体。 数据集详细信息 列名称 描述 日期 数据收集日期 人员 ID 每个人的唯一标识符 年龄 当事人年龄(18-60岁) 性别 男性、女性或其他 睡眠开始时间 该人就寝时间(24 小时制) 睡眠结束时间...
    packageimg
  • 包含精神分裂症人口统计和临床数据的综合数据集

    2025年2月17日 60 26 3

    精神分裂症健康数据集 该数据集全面收集了精神分裂症患者的人口统计、临床和社会心理信息。它是研究人员、医生和数据科学家的宝贵资源。该数据集包括患者的诊断状态、症状评分、治疗历史和社会因素。 列和说明 Patient_ID — 分配给每个患者的唯一标识符 年龄 — 患者的年龄(18 至 80 岁之间) 性别 — 0:女,1:男 教育程度 —...
    packageimg
  • 使用睡眠和眼表属性预测干眼病的数据集

    2025年2月17日 170 17 2

    该综合数据集旨在根据睡眠质量、睡眠时间、眼睛发红、瘙痒、屏幕时间、蓝光滤光片使用情况和眼睛疲劳等关键属性对干眼症 (DED) 进行预测建模和诊断分析。它包括年龄从 18 岁到 45 岁不等的不同受试者的结构化数据,使研究人员和医疗保健专业人员能够探索生活方式因素与眼部健康之间的相关性。该数据集可用于机器学习模型、统计分析和临床决策,以增强 DED...
    packageimg
  • 睡眠健康和数字屏幕暴露数据集

    2025年2月17日 270 23 2

    了解睡眠质量、压力水平和数字屏幕暴露之间的关系对于分析现代生活方式对健康的影响至关重要。此数据集提供了影响睡眠和眼睛健康的各种因素的详细见解,包括睡眠时间、压力、身体活动、病史和睡前使用数字设备。 数据集概述 该数据集包含从个人收集的多项健康相关属性,包括睡眠质量、压力水平、心率和屏幕接触习惯。它可用于统计分析、机器学习建模和健康相关研究。 列描述...
    packageimg
  • 谷歌股票价格数据:2020 年至 2025 年谷歌每日历史股价

    2025年2月17日 200 23 9

    该数据集包括2020 年至 2025 年谷歌 (GOOGL) 的每日历史股价。它包含开盘价和收盘价、每日最高价和最低价、调整后的收盘价和交易量等重要财务指标。这些信息提供了有关该股在五年时间范围内表现的宝贵见解。 列说明: 价格:股票数据的日期(需要清理,因为前两行是标题)。 调整收盘价:调整后的收盘价,考虑了股息和拆股等事件。...
    packageimg
  • 移动5G网络资源分配数据集

    2025年2月14日 50 26 5

    “5G网络资源分配数据集”, 数据集概述: 这个数据集就像是网络使用的“监控记录”,记录了不同时间用户怎么用网络的,包含了视频通话、游戏、流媒体、下载、网页浏览、物联网设备、紧急服务等。它记录了网络信号有多强、网速有多慢(延迟)、需要多少带宽和实际分到多少带宽,主要用来分析网络表现、优化资源分配,让大家上网更顺畅。 字段对照(中英文)...
    packageimg
  • 电磁干扰数据集:用于 EMI 信号分类的数据集

    2025年2月14日 160 12 3

    该数据集是为分类任务设计的电磁干扰 (EMI) 信号和正常(未受影响)信号的集合,每个信号由 4000 个时间步长组成。幅度以毫伏 (mV) 表示。它包括 8 个不同类别的 EMI 信号和正常信号,代表电气状况和故障(总共 9 个类别)。特征表示为原始信号值,捕捉 EMI...
    packageimg
  • 新加坡超市详情统计2024

    2025年2月14日 30 30 6

    标题:深入了解新加坡超市许可证:全面统计与分析 数据内容:该数据集详细列出了从1982年1月至2024年11月间的新加坡超市的许可证信息。主要数据元素包括许可证编号、被许可方名称、建筑物名称、区块门牌号、级别编号、单元号、街道名称和新加坡邮政编码。这些数据能帮助我们掌握每个超市的位置及其经营许可的相关信息。 数据来源:互联网公开数据...
    packageimg
  • 皮马印第安人糖尿病数据集:根据不同的特征预测患糖尿病的可能性

    2025年2月14日 200 12 1

    最初来自美国国家糖尿病、消化和肾脏疾病研究所。该数据集的目标是根据数据集中包含的多个特征准确预测患者是否患有糖尿病。使用该数据集通过随机森林分类器获得了 92.86% 的准确度指标得分。甚至使用该训练模型开发了一个 Web 服务糖尿病预测系统。您可以探索探索性数据分析笔记本以更好地理解数据。 属性 正常值 范围 葡萄糖:葡萄糖 (< 140) =...
    packageimg
  • 38 个数据集中的微生物组差异

    2025年2月14日 300 13 10

    微生物组差异丰度方法在 38 个数据集中产生不同的结果。 文章数据来自 Nat Commun
    packageimg
  • 5M 树木:来自美国 63 个城市的 500 万棵城市树木的数据集

    2025年2月14日 70 19 1

    可持续城市依赖于城市森林。城市树木——城市森林的支柱——改善我们的健康、净化空气、储存二氧化碳并降低当地温度。人们对城市森林作为生态系统的了解相对较少,特别是它们的空间组成、原生状态、生物多样性和树木健康状况。在这里,我们收集并标准化了来自美国 63 个最大城市的 N=5,660,237...
    packageimg
  • 无监督学习模型:分析二手车销售数据

    2025年2月14日 174 13 8

    使用监督和无监督学习模型分析二手车销售数据 二手车市场是一个动态且非常复杂的领域,受不同标准的影响 - 制造商、车型、发动机规格、油耗、生产年份、里程和价格。在本练习中,我们将查看包含英国二手车销售事实的模拟数据。该数据由 50,000...
    packageimg
  • 使用 peft 和 lora 进行 LLM 微调的合成数据

    2025年2月14日 200 20 10

    该数据集包含对话摘要、主题和对话,用于使用参数有效微调和大型语言模型的低秩自适应创建对 LLM 模型进行微调的管道,这是一种流行且轻量级的训练技术,可显着减少可训练参数的数量。 该数据集也可在 hugging face 中使用。https://huggingface.co/datasets/knkarthick/dialogsum
    packageimg
  • 本地登革热疫情

    2025年2月14日 380 19 10

    登革热是一种蚊媒疾病,发生在世界热带和亚热带地区。轻度病例的症状与流感相似:发烧、皮疹、肌肉和关节疼痛。重度病例可导致严重出血、低血压,甚至死亡。 由于登革热是由蚊子传播的,因此其传播动态与气温和降水等气候变量有关。尽管与气候的关系很复杂,但越来越多的科学家认为,气候变化可能会造成分布变化,从而对全球公共卫生产生重大影响。...
    packageimg
  • 混凝土强度数据集

    2025年2月14日 210 13 1

    混凝土抗压强度数据集: 该数据集包含混凝土抗压强度的数据,这是建筑施工中的关键因素。它包括影响混凝土整体强度的各种输入参数,例如水泥含量、水比和养护年龄等。该数据集非常适合回归分析和机器学习模型开发,可根据输入变量预测混凝土强度。 功能描述: 水泥成分: 描述:此特征代表混凝土混合物中使用的水泥量。...
    packageimg
  • DEAP解读环境空气污染:用于研究城市空气污染的大规模时空数据

    2025年2月14日 367 28 7

    这是在IJCAI 2022的 AI for Good Track上发表的论文《使用大规模城市数据解读环境空气污染》的数据集。该论文获得了该 Track 的最佳论文奖。 [ Github Repo ] 该数据集引入了一个大规模时空数据集,涉及城市空气污染的所有主要参与者。该数据集结合了多种来源,以获取研究城市空气污染所必需的信息 -...
    packageimg