-
人脸检测数据集YOLO格式FaceDetectionDataYOLOFormatDataset-anishjosh
人脸检测数据集YOLO格式FaceDetectionDataYOLOFormatDataset-anishjosh 数据来源:互联网公开数据 标签:人脸检测,数据集,计算机视觉,图像识别,目标检测,深度学习,人工智能,YOLO格式 数据概述: 该数据集包含用于人脸检测任务的数据,记录了图像中的人脸位置和相关信息。主要特征如下:...
-
垃圾邮件识别数据集SpamDetectionDataset-ripcurl
垃圾邮件识别数据集SpamDetectionDataset-ripcurl 数据来源:互联网公开数据 标签:垃圾邮件,数据集,文本分类,机器学习,自然语言处理,电子邮件,信息安全,数据挖掘 数据概述: 该数据集包含来自电子邮件通信中的大量邮件数据,主要用于垃圾邮件的识别和分类任务。主要特征如下:...
-
性别中立与包容性文本数据集-pravinkalse
性别中立与包容性文本数据集-pravinkalse 数据来源:互联网公开数据 标签:性别中立,包容性,文本分析,自然语言处理,社会科学,语言模型,数据集,文本生成 数据概述: 该数据集包含来自互联网的文本数据,旨在促进对性别中立和包容性语言的研究与应用。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期和来源的文本。...
-
Python数据导入学习数据集-jaberimohamedhabib
Python数据导入学习数据集-jaberimohamedhabib 数据来源:互联网公开数据 标签:Python,数据导入,数据集,编程学习,数据分析,数据处理,CSV,Excel 数据概述: 该数据集包含多种用于Python数据导入学习的数据集,旨在帮助初学者掌握在Python环境中导入和处理不同类型数据的技能。主要特征如下: 数据类型:...
-
大规模语言模型开源项目LMSYS的快速版LLaMA数据集LMSYSOpen-sourceFastLLaMADataset-rushali98
大规模语言模型开源项目LMSYS的快速版LLaMA数据集LMSYSOpen-sourceFastLLaMADataset-rushali98 数据来源:互联网公开数据 标签:自然语言处理,大型语言模型,数据集,LLaMA,开源,文本生成,机器学习,预训练 数据概述:...
-
国际语音识别大赛IPACompetition数据集-wenguangzhouharry
国际语音识别大赛IPACompetition数据集-wenguangzhouharry 数据来源:互联网公开数据 标签:语音识别,数据集,音频分析,深度学习,自然语言处理,声学模型,语音信号处理,人工智能 数据概述: 该数据集源自国际语音识别比赛(IPA Competition),主要包含用于语音识别任务的音频数据。主要特征如下: 时间跨度:...
-
邮件分析数据集EmailAnalysisDataset-sanjayyym
邮件分析数据集EmailAnalysisDataset-sanjayyym 数据来源:互联网公开数据 标签:邮件分析,文本挖掘,数据集,自然语言处理,情感分析,垃圾邮件检测,信息检索,机器学习 数据概述: 该数据集包含来自互联网的邮件数据,主要用于邮件内容分析,情感分析,垃圾邮件检测等任务。主要特征如下:...
-
阿拉伯儿童故事翻译样本数据集SampleTranslatedArabicChildrenStoriesDataset-raidouahioune
阿拉伯儿童故事翻译样本数据集SampleTranslatedArabicChildrenStoriesDataset-raidouahioune 数据来源:互联网公开数据 标签:儿童故事,翻译研究,语言处理,数据集,阿拉伯语,自然语言处理,文化研究,教育材料 数据概述:...
-
机器学习基础数据文件数据集-satishgunjal
机器学习基础数据文件数据集-satishgunjal 数据来源:互联网公开数据 标签:机器学习,数据集,数据预处理,数据分析,Python,统计学,数据科学,初学者 数据概述: 该数据集包含一系列用于机器学习基础学习的数据文件,旨在帮助初学者理解和实践数据预处理,特征工程和模型训练等关键步骤。主要特征如下:...
-
英语到印地语翻译数据集English-to-HindiTranslationDataset-vimlkumar
英语到印地语翻译数据集English-to-HindiTranslationDataset-vimlkumar 数据来源:互联网公开数据 标签:机器翻译,语言处理,数据集,印地语,英语,自然语言处理,翻译研究,多语言 数据概述: 该数据集包含英语到印地语的翻译对,记录了4000个英语句子及其对应的印地语翻译。主要特征如下:...
-
GDPR法规条款数据集GDPRArticlesDataset-iuliabunescu23
GDPR法规条款数据集GDPRArticlesDataset-iuliabunescu23 数据来源:互联网公开数据 标签:数据保护,隐私法规,GDPR,法律研究,政策分析,合规管理,数据安全,法律文档 数据概述: 该数据集包含欧盟通用数据保护条例(GDPR)的官方条款文本,记录了GDPR法规的详细条款和规定。主要特征如下:...
-
芝加哥警局辖区人口统计与社会经济数据集-robertyu02
芝加哥警局辖区人口统计与社会经济数据集-robertyu02 数据来源:互联网公开数据 标签:芝加哥,警局,人口统计,社会经济,辖区,犯罪,教育,收入,种族,年龄,住房,数据分析 数据概述:...
-
航空旅行信息系统意图识别训练数据集ATISIntentsTrainDataset-航空旅行信息系统意图识别训练数据集-dwaipayanduttadd
航空旅行信息系统意图识别训练数据集ATISIntentsTrainDataset-航空旅行信息系统意图识别训练数据集-dwaipayanduttadd 数据来源:互联网公开数据 标签:自然语言处理,意图识别,数据集,机器学习,语音识别,智能问答,人工智能,航空服务 数据概述:...
-
国家航空航天局NASA轴承数据集NARSBearingDataset-wuanming
国家航空航天局NASA轴承数据集NARSBearingDataset-wuanming 数据来源:互联网公开数据 标签:轴承,振动,数据集,机械工程,故障诊断,信号处理,机器学习,工业应用 数据概述:该数据集由美国国家航空航天局(NASA)提供,记录了轴承在不同工况下的振动数据,用于轴承故障诊断和预测性维护。主要特征如下:...
-
植物病害诊断对话数据集-rahulrwl
植物病害诊断对话数据集-rahulrwl 数据来源:互联网公开数据 标签:植物病害,诊断,对话,自然语言处理,机器学习,农业,疾病识别,文本分析 数据概述: 该数据集包含植物病害诊断相关的对话记录,记录了用户与诊断系统之间的互动。主要特征如下: 时间跨度: 数据记录的时间范围为不确定,取决于对话的收集时间。 地理范围:...
-
英国广播公司新闻文本数据集BBCNewsTextDataset-avishi
英国广播公司新闻文本数据集BBCNewsTextDataset-avishi 数据来源:互联网公开数据 标签:新闻,文本,数据集,自然语言处理,文本分类,机器学习,新闻报道,舆情分析 数据概述: 该数据集包含来自英国广播公司(BBC)的新闻文章文本数据,用于文本分类和自然语言处理任务。主要特征如下:...
-
巴西邮政编码CEP信息数据集2018年5月-wfoliveira
巴西邮政编码CEP信息数据集2018年5月-wfoliveira 数据来源:互联网公开数据 标签:巴西,邮政编码,地理信息,数据集,地址数据,数据分析,空间数据,物流 数据概述: 该数据集包含来自巴西邮政(Correios)的邮政编码(CEP)信息,记录了巴西各地的邮政编码及其对应的地址信息。主要特征如下:...
-
泰米尔语NLP任务训练数据集TamilNLPTaskTrainingDataset-rohit7420
泰米尔语NLP任务训练数据集TamilNLPTaskTrainingDataset-rohit7420 数据来源:互联网公开数据 标签:自然语言处理,泰米尔语,文本分类,机器翻译,情感分析,数据集,语言学,机器学习 数据概述: 该数据集包含用于泰米尔语自然语言处理(NLP)任务的训练数据。主要特征如下: 时间跨度:...
-
大型语言模型LLM考试数据集-baorbaor
大型语言模型LLM考试数据集-baorbaor 数据来源:互联网公开数据 标签:大型语言模型,LLM,考试,评估,自然语言处理,人工智能,NLP,机器学习 数据概述: 该数据集包含用于评估大型语言模型(LLM)在考试场景中的表现的数据。主要特征如下: 时间跨度:数据记录的时间范围为当前,持续更新。...
-
核物理结合能数据集-mayank102106
核物理结合能数据集-mayank102106 数据来源:互联网公开数据 标签:核物理,结合能,数据集,原子核,核结构,物理学,数据分析,科学研究 数据概述: 该数据集包含核物理结合能的数据,记录了不同原子核的结合能信息。主要特征如下: 时间跨度:数据记录的时间范围涵盖了从早期核物理实验至今的多个时期。...



