-
植物疾病检测数据集
植物疾病数据集由印度理工学院的一组研究人员创建,最初在一篇研究论文中进行了描述。其中一位作者 Pratik Kayal 已在GitHub上分享了该数据集,可供公众使用。PlantDoc 数据集包含 13 种不同植物物种的总共 2,569 张图像。该数据集分为 30 个不同的类别,标签指示每张图像是健康的还是患病的。数据集内共有 8,851... -
用于对印地语 NCERT 科学教科书上的 Gemma 2 进行微调的结构化数据集
该数据集经过精心设计,旨在微调 Gemma 2 语言模型,以生成印地语教育内容,专门针对 3 年级至 10 年级的科学主题。该数据集使用印地语 NCERT 教科书构建,由三个结构化组件组成,可实现有效的语言模型训练。 数据集组件 1. 图书数据 包含 3 年级至 10 年级印地语 NCERT 科学教科书的 PDF 文件。... -
PyTorch 几何外部库
用于 Kaggle Env 的 PyTorch 几何外部库轮子 该数据集是 PyTorch Geometric外部库的 Python wheel 包文件(只需安装PyG即可) 。PyTorch pip install torch_geometricGeometric 是用于构建图神经网络的 torch... -
GPT GCJ 数据集:检测 LLM 编写的 Java 代码
来自 GCJ 2020 的 76K+ Java 文件,其中 17K 由 GPT-4o 生成,用于 AI 检测 GPT Java GCJ 源代码数据集 该数据集由 2020 年 Google Code Jam 竞赛中 1,000 多位作者编写的共 76,089 个 Java 源代码文件和用于代码生成检测的 GPT-4o 重写代码组成。 随着 OpenAI... -
DUTS 大规模图像显著性检测基准数据集
DUTS 是一个大规模显著性检测数据集,包含 10,553 张训练图像和 5,019 张测试图像。所有训练图像均来自ImageNet DET 训练/验证集,而测试图像则来自 ImageNet DET 测试集和SUN 数据集。训练集和测试集都包含对显著性检测非常具有挑战性的场景。精确的像素级基本事实由 50 名受试者手动注释。 -
鱼类探测(带标签)
鱼类物种检测数据集是一个经过精心策划的集合,旨在开发和测试专注于识别各种鱼类物种的物体检测模型。借助此数据集,研究人员和开发人员可以利用先进的计算机视觉技术对各种水生环境中的鱼类进行分类。 数据集组成 该数据集共包含 8,242 张带注释的图像,分为十三个不同的鱼类: 神仙鱼 蓝唐 蝴蝶鱼 小丑鱼 金鱼 丝足鱼 莫里什偶像 孔雀鱼 带状甜唇 三条纹雀鲷... -
英国 36 个站点的历史气象站数据
英国气象局自 1854 年成立以来一直负责监测英国天气。英国有 36 个气象站(通常位于皇家空军基地)收集信息,用于预测未来天气模式并发布公共建议。最近,这些大型数据集已成为调查英国气候在过去 150 多年中如何变化的有用工具。 内容 列: year:进行测量的年份 month:进行测量的月份 tmax:平均每日最高气温(℃)... -
Slovo:俄罗斯手语(RSL)识别的视频数据集
Slovo - 俄罗斯手语数据集 我们引入了一个用于俄罗斯手语任务的大规模视频数据集Slovo。Slovo数据集大小约为16 GB,包含来自 194 位歌手的1000 个手语手势的20400 个RGB 视频。每类有 20 个样本。数据集按主题分为训练集和测试集。训练集包括 15300 个视频,测试集包括 5100 个视频。总视频录制时间约为 9.2... -
狗牌照数据集:纽约市有效狗证
根据法律规定,居住在纽约市的所有狗主人都必须为他们的狗办理许可证。数据来源于 DOHMH 狗许可证系统,狗主人可以在此申请和续签狗许可证。 每条记录代表了该年内有效的唯一狗执照,但不一定是每只狗的唯一记录,因为在年内续签的执照会产生有效执照期限的单独记录。每条记录代表了该只狗在一年的时间范围内的一个唯一执照期限。... -
PCB 缺陷数据集(带有 YOLO 注释)
内容 数据集中定义的缺陷有:缺孔、鼠咬、断路、短路、毛刺、杂散铜。北京大学人机交互开放实验室发布了PCB缺陷数据集。扩充后的数据集包含10668张图片和相应的标注文件。 致谢 R. Ding、L. Dai、G. Li 和 H. Liu,“TDD-net:用于印刷电路板的微型缺陷检测网络”,载于《CAAI 智能技术学报》,第 4 卷,第 2 期,第... -
FSL 数据集
FSL 数据集,26 个字母,每个字母 450 张图片,总共 11700 张图片 菲律宾手语字母表的数据集,包含 26 个字母,每个字母有 450 张图片,共计 11700 张图片。该数据集由研究人员在网络摄像头前做出手势创建,然后对视频进行处理以裁剪手部区域,并将其调整为当前尺寸。 -
用于天气分类的多类图像
用于图像分类的多类天气数据集 (MWD) 是研究论文《使用异构集成方法从静态图像中进行多类天气识别》中使用的宝贵数据集。该数据集通过提取各种特征来识别不同的天气状况,为户外天气分析提供了一个平台。 -
-
机械齿轮振动数据集:测量六种齿轮在不同工作条件下的振动
可靠的机电一体化系统对于现代制造业和我们的日常生活都至关重要。它们可以帮助预测机器停机时间、查找错误原因或警告危险设置。然而,它们的主要部件(例如齿轮)最有可能损坏,而且几乎没有机会提前预测,每年给行业造成数百万美元的损失。 数据为时间序列类型 要进行数据采样,首先需要选择采样时长ts。例如,ts = 1(秒)表示每个样本都是 1/0.0002 =... -
塑料物体检测数据集
该数据集包含日常生活中常见的各种塑料物品的图像。每幅图像都用塑料物品周围的边界框标注,可用于计算机视觉应用中的物体检测任务。该数据集包含各种各样的物品,例如牛奶包、番茄酱袋、钢笔、塑料瓶、聚乙烯袋、洗发水瓶和袋、薯片包、清洁喷雾瓶、洗手液瓶等,为开发物体检测模型提供了丰富的训练材料。 该数据集由印度 DataCluster Labs... -
印度空气污染数据(2020-2023)
2020 年至 2023 年印度主要城市空气污染监测数据 动机 我们呼吸的空气质量决定了我们的生活质量。在当今世界,特别是在印度这样一个人口众多的国家,我们呼吸的空气中充满了有毒化合物,这些化合物直接或间接地影响着人类健康,更好地了解全国各地的趋势使我们能够做出有利于社会的理性决策。 这个数据集包含什么? 该数据集包含 2020 年至 2023... -
-
地形导航数据:利用卫星数据进行开源无人机航拍模拟
这些数据可以在GitHub存储库中轻松加载、访问和处理。 TerrAInav Sim 孟菲斯 使用 TerrAInav-Sim 生成的数据集位于“TerrAInav Sim Memphis”文件夹中,其中包含孟菲斯农业中心区域的栅格图像,左上角为坐标 (35.16, -89.90),右下角为坐标 (35.115, -89.823)。基于无人机的模拟以... -
淡水鱼疾病(南亚水产养殖)
包含 500 多张南亚鱼类图像的淡水鱼疾病检测数据集 该数据旨在建立基于深度学习的鱼类皮肤图像疾病识别模型,从而帮助水产养殖。数据集中共有 7 类 细菌性疾病 - 气单胞菌病 。共有 250 张图片。 细菌性鳃病。图片总数 250 细菌性红病。图片总数 250 真菌病. 水霉病 图像总数 250 健康的鱼。图片总数 250 寄生虫病。图片总数 250...