-
Solana 历史数据 2021 - 2024
该数据集包括 2021 年 1 月 1 日至 2024 年 9 月 29 日 Solana (SOL) 的每日价格和交易量数据。 数据包括用于分析 Solana 随时间的表现和趋势的基本交易指标。这些指标可用于预测、交易策略或其他财务分析。 -
交通事故 - Vision Zero 芝加哥交通死亡统计
数据的内容: 该数据集包含芝加哥市内的交通死亡事故信息,按照Vision Zero计划进行统计,数据由芝加哥交通局审核。 数据来源: 互联网公开数据 行业用途划分: 交通安全 城市交通管理 公共政策制定 数据用途简介: 用于分析交通死亡事故,制定交通安全改善措施,并推动Vision Zero目标的实现。 -
酒店预订需求数据集 (Hotel Booking Demand Dataset)
数据概述: 本数据集包含了城市酒店和度假酒店的预订信息,旨在帮助用户探索酒店预订相关的关键问题。数据集涵盖了预订时间、入住时长、成人、儿童和婴儿数量、可用的停车位数量等多种信息。所有个人身份识别信息均已从数据中移除,确保了数据的隐私性。 数据用途概述:... -
各国接收的国际援助金额年度记录 (1960-2022)
数据内容: 该数据集包含了全球范围内多个国家和地区接收到的官方发展援助(ODA)的详细信息。数据字段包括实体名称、代码、年份以及具体的援助金额。通过这些数据,可以分析不同国家和地区在不同年份接收到的援助规模及其变化趋势。 数据来源: 互联网公开数据 数据用途: 该数据集可用于国际发展、公共政策、经济学、援助评估等行业。具体用途包括: 1.... -
印度城市空气质量指数 (2020 - 2024)
数据来自中央污染控制委员会 (CPCB) 的存储库 - https://cpcb.nic.in/ 数据集包含以下属性: 时间戳:记录数据的日期 (DD-MM-YYYY)。范围从2020-01-01 到 2024-12-31。 位置:收集数据的位置。其值为“班加罗尔 - Silk Board”、“金奈 - Alandur Bus Depot”、“德里 -... -
通过人工智能弥合沟通鸿沟:阿拉伯手语字母表 (ArSL) 数据集
该数据集包含 6,000 张手势图像,代表 30 个阿拉伯字母(ا 至 ي),以及一个经过训练的模型。该数据集专为手语识别研究而设计,可帮助开发人员为聋人和听力障碍者群体构建工具。 包含的文件 data/:30 个阿拉伯手语字母的原始图像(总共 6 000 张图像)。 class_mapping.csv:将类别... -
华盛顿州许可证部门 (DOL) 注册的纯电动汽车 (BEV) 和插电式混合动力电动汽车 (PHEV)
电动汽车详细登记,包括规格、位置和实用数据 该数据集显示了目前通过华盛顿州许可证部门 (DOL) 注册的纯电动汽车 (BEV) 和插电式混合动力电动汽车 (PHEV) 行数: 223,995 列数: 17 包含缺失值 列说明: VIN(1-10): 车辆识别号的前 10 个字符。 县: 车辆注册所在的县。 城市: 车辆注册所在的城市。 州:... -
2010 年至 2023 年雅加达每日空气质量指数 (AQI)
该数据集包含 2010 年至 2023 年期间雅加达特区 5 个空气质量监测站 (SPKU) 测得的空气质量指数 (AQI) 或空气质量标准指数 (ISPU)。 文件描述 在此数据集中,有两种类型的文件: ispu_dki x:此文件代表每个监测站的 AQI 测量结果。“x”是站点序列号。此文件包含从2010 年到 2021 年的测量结果。... -
香蕉叶斑病 (BananaLSD) 数据集
香蕉种植经常受到各种疾病的挑战,这些疾病严重影响产量。这些疾病对香蕉植株造成不利影响,导致生长受阻、果实产量下降,甚至植株死亡。其后果是深远的,因为受感染的植株难以结出可销售的果实,导致香蕉种植者遭受经济损失,并有可能扰乱全球香蕉供应。 数据集中的香蕉叶斑病 该数据集包含多种图像,展示了三种主要的香蕉叶斑病,即: 叶斑病 科达娜... -
MultiWOZ (Multi-domain Wizard-of-Oz)
Multi-Domain Wizard-of-Oz 数据集 (MultiWOZ),一个完全标记的人类与人类书面对话的集合,跨越多个领域和主题。在 10k 个对话的大小上,它至少比以前所有带注释的面向任务的语料库大一个数量级。 -
SQuAD (Stanford Question Answering Dataset)问答数据集
斯坦福问答数据集 (SQuAD) 是一个阅读理解数据集,由众包工作人员在一组维基百科文章中提出的问题组成,其中每个问题的答案都是相应阅读文章或问题的一段文本或跨度可能无法回答。 -
注意力缺陷多动障碍 (ADHD)基因数据集
注意力缺陷多动障碍 (ADHD) 是一种普遍的神经发育障碍,主要由遗传因素引起。在这里,我们介绍了一项全基因组关联研究,对 ADHD 进行了荟萃分析,其中包括 38,691 名 ADHD 患者和 186,843 名对照者。我们确定了 27 个全基因组显著位点,突出了 76 个潜在风险基因,这些基因在早期大脑发育中特别表达的基因中富集。总体而言,ADHD... -
自闭症障碍 (ASD)基因数据集
自闭症谱系障碍 (ASD) 的遗传研究摘要 自闭症谱系障碍(Autism Spectrum Disorder, ASD)是一类具有高度遗传性和异质性的神经发育表型群体,其患病率在儿童中超过 1%。尽管常见的遗传变异对 ASD 易感性有重要贡献,但迄今为止,尚未有任何单一遗传变异与 ASD 稳定关联。... -
双相情感障碍 (Bipolar Disorder)数据集
双相情感障碍 (Bipolar Disorder) 是一种具有复杂病因的遗传性精神疾病。本研究对 41,917 名双相情感障碍患者 和 371,549 名欧洲血统对照者 进行了基因组广泛关联研究 (GWAS),鉴定出 64 个相关基因组位点。 -
ETT (Electricity Transformer Temperature)
电力变压器温度 (ETT) 是电力长期部署的关键指标。该数据集由来自中国两个分离县的2年数据组成。为了探索长序列时间序列预测 (LSTF) 问题的粒度,创建了不同的子集,{ETTh1,ETTh2} 为1小时级,ETTm1为15分钟级。每个数据点由目标值 “油温” 和6个功率负载特征组成。火车/val/测试为12/4/4个月。 -
SST (Stanford Sentiment Treebank)
斯坦福情感库是一个带有完全标记的解析树的语料库,可以全面分析情感在语言中的构成影响。该语料库基于 Pang 和 Lee (2005) 引入的数据集,由从电影评论中提取的 11,855 个单句组成。它使用斯坦福解析器进行解析,包括来自这些解析树的总共 215,154 个独特的短语,每个短语由 3... -
GeoQA (Geometric Question Answering)
GeoQA 是一个用于自动解决几何问题的数据集,包含 5,010 个几何问题和相应的注释程序,说明了给定问题的解决过程 与另一个公开可用的数据集 GeoS 相比,GeoQA 大 25 倍,其中程序注释可以提供实用的未来研究明确和可解释的数值推理的测试平台。 -
DRCD (Delta Reading Comprehension Dataset)
一个数据集,其中包含 2,221 个来自不同学科(历史、生物学、地理和哲学)的十二年级入学考试的问题,以及来自历史在线测验的 412 个附加问题。 -
国际数学奥林匹克 (IMO) 数据
国际数学奥林匹克 (IMO) 是针对高中生的世界数学锦标赛,每年在不同的国家举行。第一届 IMO 于 1959 年在罗马尼亚举行,共有 7 个国家参赛。它逐渐扩展到来自五大洲的 100 多个国家。比赛由 6 道题组成,连续两天举行,每道题 3 道。 随着时间的推移,国家排名如何变化? 参与人数的性别分布如何?最高分的分布如何?... -
纽约MTA长岛铁路 (LIRR) 延误验证:自2010年起导图
数据的内容:此数据集详细列出了自2010年起,所有延误的长岛铁路 (LIRR) 列车。每条记录包含列车是否取消、部分取消或具体的延误分钟数,以及列车编号和所运行的分支信息。这些数据有助于分析长岛铁路的运营效率和可靠性。 数据来源:互联网公开数据 行业用途划分:公共交通运营管理与分析 数据用途简介: 该数据集旨在提供有关长岛铁路 (LIRR)...