-
全球塑料垃圾总产生量
过去 70 年来,塑料产量急剧增加。1950 年,全球塑料产量仅为 200 万吨。如今,全球塑料产量已超过 4.5 亿吨。 塑料给我们的生活带来了许多价值:它是一种廉价、多功能且无菌的材料,用于建筑、家用电器、医疗器械和食品包装等各种用途。 然而,如果塑料垃圾管理不善——没有回收、焚烧或存放在密封的垃圾填埋场——它就会成为环境污染物。每年有 100...
-
-
世界各国人口(2025 年)
该数据集包含按国家/地区划分的世界人口详细信息。根据世界人口计量表,目前世界人口为 82 亿。人口最多的国家是印度,其次是中国和美国。 属性信息 排名: 按人口排列的国家排名。 国家 :国家名称。 人口(2024): 每个国家的当前人口。 年度变化: 人口年度变化百分比。 净变化:人口的净变化。 密度(P/Km²):人口密度(每平方公里的人口数)...
-
电子商务消费者趋势和偏好
该数据集全面洞察了消费者的在线购物行为和偏好。它基于调查回复,重点关注购物频率、首选付款方式、吸引力因素、安全问题和经常购买的产品类别等关键方面。该数据集为有兴趣了解在线消费者趋势和改进电子商务策略的企业、营销人员和研究人员提供了宝贵的信息。 主要特点: 人口统计信息:受访者的性别,帮助分析性别群体的偏好。 购物频率:受访者进行网上购物活动的频率。...
-
全球难民流动和状况综合统计数据(2019-2024)
该数据集提供了 2019 年至 2024 年期间难民、寻求庇护者和其他联合国难民事务高级专员公署 (UNHCR) 关注的个人的流动和状况的详细统计数据。它涵盖了各种类别,例如 UNHCR 授权的难民、寻求庇护者、返回难民、境内流离失所者 (IDP)、返回的 IDP、无国籍人士和其他受关注人员。数据按原籍国和庇护国分类,提供全球难民和庇护趋势的全面视图。...
-
2014 - 2024 年全球人口增长和健康趋势
该数据集提供了 2014 年至 2024 年全球各国人口统计数据和健康指标的全面视图。它将人口数据与重要的健康相关指标相结合,使其成为了解全球人口增长和健康结果趋势的宝贵资源。研究人员、数据科学家和政策制定者可以利用此数据集分析全球人口动态与健康表现之间的相关性。 主要特点: 国家:国家的名称。 年份:数据年份(2014-2024)。...
-
-
基于症状的中风风险预测数据集
该数据集经过精心策划,以支持中风风险预测研究,帮助开发估计模型: 一个人是否有中风的风险(二元分类)。 中风发生的百分比可能性(回归分析)。 它专为医疗 AI 和预测性医疗保健中的机器学习和深度学习应用而设计。数据集是平衡的,确保 50% 的记录属于有风险的个人,50% 的记录属于没有风险的个人。 数据集生成过程...
-
二氧化碳排放量逐年变化(1751 年至 2023 年)
二氧化碳 (CO₂) 排放量的绝对年度变化量,以吨为单位。 该数据集包含 1751 年至 2023 年期间每个国家二氧化碳排放量逐年变化的详细信息。二氧化碳排放是全球气候变化的主要驱动因素。人们普遍认识到,为了避免气候变化的最严重影响,世界需要紧急减少排放。但是,如何在地区、国家和个人之间分担这一责任一直是国际讨论中争论不休的焦点。...
-
英雄联盟比赛数据集(2025 年)
该数据集提供了 2025 年收集的有关英雄联盟比赛的详细信息。它涵盖了游戏的各个方面,包括玩家统计数据、团队表现和比赛元数据。该数据集非常适合统计分析、机器学习项目和电子竞技研究。 数据是使用查询官方 Riot Games API 的自定义 Python 脚本获取的。此脚本从单个玩家的 PUUID...
-
全球通货膨胀率:各国历史通胀数据(1960 -2025)
该数据集提供了全球通货膨胀率的全面历史记录,涵盖了从 1960 年到现在的时期。它包括多个国家和地区的国家级通货膨胀数据,是经济分析、财务预测和宏观经济研究的宝贵资源。 数据来源:https://datos.bancomundial.org/indicador/FP.CPI.TOTL.ZG?... -
DeepSeek 上的推文和反应:Twitter/X 上有关 DeepSeek 模型的推文和反应
该数据集包含有关 DeepSeek 及其发布的模型的推文和反应,以及其他密切相关的关键词,例如 NVIDIA、OPENAI、ANTHROPIC、META、LLAMA 等。
-
UFC 比赛统计数据
该数据集从网络上抓取了从 2016 年 7 月到 2024 年 11 月的每场 UFC 比赛。这些统计数据是逐轮累积的,包括结果和事件属性。 视差数据集找到 Fighter1(红角)和 Fighter2(蓝角)之间的每个统计差异。 UFC 比赛统计元数据: 活动信息: 拳手 1、拳手 2:参赛拳手姓名 获胜者?:比赛获胜者...
-
医疗工作者心理健康数据集
医疗保健劳动力心理健康数据集旨在探索医疗保健行业的工作场所心理健康挑战,该行业以高压力和倦怠率而闻名。 该数据集使用户能够分析与以下方面相关的主要趋势: 工作压力源: 检查繁重的工作量、恶劣的工作环境和情感需求的影响。 心理健康结果: 了解压力和倦怠如何影响工作满意度、旷工率和离职意向。...
-
全球商品与服务出口:按国家、收入群体和地区划分的商品和服务出口(1960 -2025)
该数据集提供了 1960 年至今世界各国商品和服务出口占 GDP 百分比的历史数据。它包含按国家、收入群体和地区分类的信息,对经济分析、贸易研究和政策研究很有价值。该文件包含 1960 年至今每个国家商品和服务出口占 GDP 百分比的年度数据。其中包括国家名称、ISO 代码、经济区域和收入分类等基本详细信息。 数据来源...
-
陨石着陆地球数据:全球 34,500 多颗陨石着陆的详细记录
该数据集包含全球 34,513 颗已知陨石着陆的详细记录,由陨石学会汇编并托管在 NASA 的开放数据门户上。它包括有关陨石的基本信息,例如其分类、质量、位置以及它们是被观察到坠落还是后来被发现。 数据集概述 数据集由以下主要列组成: 名称——陨石的正式名称。 id – 每颗陨石的唯一标识符。 nametype – 指示陨石是否: 有效:大多数陨石...
-
IMDb电影元数据的集合,包括评级、评论、类型和运行时间
该数据集包含 IMDb 电影元数据,包括电影名称、上映年份、年龄分级、类型和用户评分。它为数据分析、机器学习和推荐系统提供了宝贵的见解。 name - 电影名称 year - 电影上映年份 movie_rated - 官方年龄分级 run_length - 电影时长(分钟) types - 与电影相关的类型 release_date -...
-
2024 年全球最幸福国家排名(基于幸福指数)
该数据集包含 2024 年全球最幸福国家排名,数据来源于《世界人口评论》。排名基于各种幸福指标,例如收入、社会支持、预期寿命、生活选择自由、慷慨程度和对腐败的看法。数据反映了 2024 年各国幸福指数的全球排名,深入了解了影响国家幸福的因素。
-
使用 peft 和 lora 进行 LLM 微调的合成数据
该数据集包含对话摘要、主题和对话,用于使用参数有效微调和大型语言模型的低秩自适应创建对 LLM 模型进行微调的管道,这是一种流行且轻量级的训练技术,可显着减少可训练参数的数量。 该数据集也可在 hugging face 中使用。https://huggingface.co/datasets/knkarthick/dialogsum
-
本地登革热疫情
登革热是一种蚊媒疾病,发生在世界热带和亚热带地区。轻度病例的症状与流感相似:发烧、皮疹、肌肉和关节疼痛。重度病例可导致严重出血、低血压,甚至死亡。 由于登革热是由蚊子传播的,因此其传播动态与气温和降水等气候变量有关。尽管与气候的关系很复杂,但越来越多的科学家认为,气候变化可能会造成分布变化,从而对全球公共卫生产生重大影响。...



