-
港口环境监测外海数据集PHEMSDatasetOuter-zipzipzip
港口环境监测外海数据集PHEMSDatasetOuter-zipzipzip 数据来源:互联网公开数据 标签:港口环境,外海监测,数据集,交通运输,环境工程,机器学习,数据分析,波浪 数据概述: 该数据集包含了来自港口环境监测系统(PHEMS)的外海环境数据,记录了外海区域的波浪、风力、水流等环境要素。主要特征如下:...
-
CourseraPySpark音乐推荐项目数据集-raisinbl
CourseraPySpark音乐推荐项目数据集-raisinbl 数据来源:互联网公开数据 标签:音乐推荐,PySpark,数据集,用户行为,机器学习,大数据,数据分析,推荐系统 数据概述: 该数据集来源于Coursera上的PySpark课程项目,主要记录了用户在音乐平台上的交互行为数据,用于构建音乐推荐系统。主要特征如下:...
-
淋巴细胞白血病文章数据集-javeria
淋巴细胞白血病文章数据集-javeria 数据来源:互联网公开数据 标签:白血病,淋巴细胞,医学,数据集,文本分析,自然语言处理,疾病研究,学术文献 数据概述:该数据集包含来自PubMed的关于淋巴细胞白血病(Lymphoblastic Leukemia)的医学文章数据,记录了相关疾病的研究、治疗和临床试验信息。主要特征如下:...
-
Alura词向量数据集AluraWord2VecDataset-romariogomesbr
Alura词向量数据集AluraWord2VecDataset-romariogomesbr 数据来源:互联网公开数据 标签:自然语言处理,词向量,数据集,机器学习,文本分析,深度学习,NLP,语义分析 数据概述: 该数据集包含来自Alura项目的词向量数据,记录了大规模文本语料库中词汇的向量表示。主要特征如下:...
-
AI生成内容数据集AI-Stuff-jordanpainter
AI生成内容数据集AI-Stuff-jordanpainter 数据来源:互联网公开数据 标签:人工智能,生成模型,数据集,文本生成,图像生成,多模态,自然语言处理,机器学习 数据概述: 该数据集包含各种由人工智能模型生成的内容,涵盖文本、图像、音频等多种模态。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于生成内容的时间。...
-
作弊检测数据集CheatingDetectionDataset-rahimatanveer1
作弊检测数据集CheatingDetectionDataset-rahimatanveer1 数据来源:互联网公开数据 标签:作弊检测,数据集,教育,学术诚信,机器学习,数据分析,文本分析,行为分析 数据概述: 该数据集包含了用于作弊检测的数据,旨在帮助识别和预防学术不端行为。主要特征如下: 时间跨度:数据记录的时间范围涵盖了多个学期和考试周期。...
-
阿里与飒达词汇数据集-farismuq2
阿里与飒达词汇数据集-farismuq2 数据来源:互联网公开数据 标签:词汇分析,数据集,情感分析,自然语言处理,文本挖掘,中文文本,语料库,语言学 数据概述: 该数据集包含了阿里和飒达相关的词汇,旨在用于词汇分析、情感分析等自然语言处理任务。主要特征如下: 时间跨度: 数据记录的时间范围不限,涵盖了从早期到现代的词汇。 地理范围:...
-
群体行为数据集SwarmBehaviourDataset-aboutakashsah
群体行为数据集SwarmBehaviourDataset-aboutakashsah 数据来源:互联网公开数据 标签:群体行为,数据集,行为分析,机器学习,动物行为,社会学,数据挖掘,人工智能 数据概述: 该数据集包含了关于动物群体行为的详细数据,记录了不同物种在各种环境下的群体运动和互动。主要特征如下:...
-
数据2009年知识发现与数据挖掘竞赛KDDCup2009工作数据集-pavanklyan
2009年知识发现与数据挖掘竞赛KDDCup2009工作数据集-pavanklyan 数据来源:互联网公开数据 标签:数据挖掘,竞赛数据集,用户行为,社交网络,机器学习,推荐系统,用户建模,社交图谱 数据概述: 该数据集源自2009年知识发现与数据挖掘(KDD)竞赛,旨在促进对用户行为和社交网络的深入理解。主要特征如下: 时间跨度:...
-
斯坦福大学自然语言处理课程单词嵌入数据集StanfordNLPCourseWordEmbeddingsDataset-png261
斯坦福大学自然语言处理课程单词嵌入数据集StanfordNLPCourseWordEmbeddingsDataset-png261 数据来源:互联网公开数据 标签:自然语言处理,词嵌入,数据集,斯坦福大学,文本分析,机器学习,深度学习,语义分析 数据概述:...
-
故事数据集StoryDataset-ahmadrezacuet
故事数据集StoryDataset-ahmadrezacuet 数据来源:互联网公开数据 标签:故事,文本数据,自然语言处理,情感分析,叙事分析,数据集,机器学习,语言模型 数据概述: 该数据集包含大量故事文本,涵盖多种主题和风格。主要特征如下: 时间跨度:数据的时间跨度取决于故事的创作时间,从古代神话传说到现代小说均有收录。...
-
锡尔赫特-纳格里手写体字符识别数据集SylhetiNagriOCRDataset-sushmit0109
锡尔赫特-纳格里手写体字符识别数据集SylhetiNagriOCRDataset-sushmit0109 数据来源:互联网公开数据 标签:OCR,手写体识别,锡尔赫特语,纳格里文字,数据集,图像识别,自然语言处理,人工智能 数据概述: 该数据集包含锡尔赫特-纳格里文字的手写体字符图像,旨在用于光学字符识别(OCR)系统的训练和评估。主要特征如下:...
-
在线性别歧视可解释性检测数据集ExplainableDetectionofOnlineSexism-EDOS-maifeeulasad
在线性别歧视可解释性检测数据集ExplainableDetectionofOnlineSexism-EDOS-maifeeulasad 数据来源:互联网公开数据 标签:性别歧视,自然语言处理,数据集,机器学习,文本分析,情感分析,社交媒体,可解释性 数据概述: 该数据集主要用于研究和开发在线性别歧视的检测模型,旨在提高模型的可解释性。主要特征如下:...
-
乌兹别克语音识别数据集VoiceRecognitionUzbekDataset-bexruznutfilloyev
乌兹别克语音识别数据集VoiceRecognitionUzbekDataset-bexruznutfilloyev 数据来源:互联网公开数据 标签:语音识别,乌兹别克语,数据集,自然语言处理,机器学习,语音处理,音频分析,语言学 数据概述: 该数据集包含乌兹别克语的语音数据,旨在用于语音识别系统的训练和评估。主要特征如下: 时间跨度:...
-
英语到印地语翻译数据集English-to-HindiTranslateDataset-saediscrazy
英语到印地语翻译数据集English-to-HindiTranslateDataset-saediscrazy 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,印地语,英语,文本翻译,语言模型,多语言 数据概述: 该数据集包含英语到印地语的翻译文本对,旨在用于机器翻译模型的训练和评估。主要特征如下: 时间跨度:...
-
生理信号监测数据集PhysiologicalSignalMonitoringDataset-bestofbests9
生理信号监测数据集PhysiologicalSignalMonitoringDataset-bestofbests9 数据来源:互联网公开数据 标签:生理信号, 心电图, 呼吸, 血氧饱和度, 临床数据, 生物医学工程, 时间序列分析, 医疗健康 数据概述: 该数据集包含来自BIDMC数据库的生理信号监测数据,记录了患者的多种生理指标。主要特征如下:...
-
马拉提语文档数据集MarathiDocumentsDataset-ashwanillkagechaad
马拉提语文档数据集MarathiDocumentsDataset-ashwanillkagechaad 数据来源:互联网公开数据 标签:马拉提语,文档数据集,自然语言处理,机器学习,文本分析,印度文化,学术资源,语言学 数据概述: 该数据集包含来自多个来源的马拉提语文档,记录了马拉提语的文本数据,适用于自然语言处理、文本分析等任务。主要特征如下:...
-
虚假新闻检测训练数据集FakeNewsDetectionTrainingDataset-shyamgsundhar
虚假新闻检测训练数据集FakeNewsDetectionTrainingDataset-shyamgsundhar 数据来源:互联网公开数据 标签:虚假新闻,数据集,文本分析,自然语言处理,机器学习,信息检索,新闻报道,舆情分析 数据概述: 该数据集包含了大量用于虚假新闻检测的文本数据,旨在帮助研究人员和开发者构建和评估虚假新闻检测模型。主要特征如下:...
-
推特文本清洗与展开缩写数据集CleanTweetswithExpandedContractionsDataset-mgmdif
推特文本清洗与展开缩写数据集CleanTweetswithExpandedContractionsDataset-mgmdif 数据来源:互联网公开数据 标签:推特,文本数据,数据清洗,自然语言处理,缩写展开,情感分析,机器学习,社交媒体 数据概述: 该数据集包含从推特(Twitter)平台收集的文本数据,并进行了清洗和缩写展开处理。主要特征如下:...
-
用户界面UI代码异味检测数据集-magisni
用户界面UI代码异味检测数据集-magisni 数据来源:互联网公开数据 标签:用户界面,代码异味,数据集,软件工程,代码分析,机器学习,代码质量,UI设计 数据概述: 该数据集包含来自用户界面(UI)代码的异味信息,旨在用于UI代码异味检测与分析。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了不同时间段的UI代码。...



