数据集 - 海数据

港口环境监测外海数据集PHEMSDatasetOuter-zipzipzip

2025年5月30日

港口环境监测外海数据集PHEMSDatasetOuter-zipzipzip 数据来源：互联网公开数据标签：港口环境，外海监测，数据集，交通运输，环境工程，机器学习，数据分析，波浪数据概述：该数据集包含了来自港口环境监测系统（PHEMS）的外海环境数据，记录了外海区域的波浪、风力、水流等环境要素。主要特征如下：...

ZIP

CourseraPySpark音乐推荐项目数据集-raisinbl

2025年5月30日

CourseraPySpark音乐推荐项目数据集-raisinbl 数据来源：互联网公开数据标签：音乐推荐，PySpark，数据集，用户行为，机器学习，大数据，数据分析，推荐系统数据概述：该数据集来源于Coursera上的PySpark课程项目，主要记录了用户在音乐平台上的交互行为数据，用于构建音乐推荐系统。主要特征如下：...

ZIP

淋巴细胞白血病文章数据集-javeria

2025年5月30日

淋巴细胞白血病文章数据集-javeria 数据来源：互联网公开数据标签：白血病，淋巴细胞，医学，数据集，文本分析，自然语言处理，疾病研究，学术文献数据概述：该数据集包含来自PubMed的关于淋巴细胞白血病（Lymphoblastic Leukemia）的医学文章数据，记录了相关疾病的研究、治疗和临床试验信息。主要特征如下：...

ZIP

Alura词向量数据集AluraWord2VecDataset-romariogomesbr

2025年5月30日

Alura词向量数据集AluraWord2VecDataset-romariogomesbr 数据来源：互联网公开数据标签：自然语言处理，词向量，数据集，机器学习，文本分析，深度学习，NLP，语义分析数据概述：该数据集包含来自Alura项目的词向量数据，记录了大规模文本语料库中词汇的向量表示。主要特征如下：...

ZIP

AI生成内容数据集AI-Stuff-jordanpainter

2025年5月30日

AI生成内容数据集AI-Stuff-jordanpainter 数据来源：互联网公开数据标签：人工智能，生成模型，数据集，文本生成，图像生成，多模态，自然语言处理，机器学习数据概述：该数据集包含各种由人工智能模型生成的内容，涵盖文本、图像、音频等多种模态。主要特征如下：时间跨度：数据记录的时间范围不固定，取决于生成内容的时间。...

ZIP

作弊检测数据集CheatingDetectionDataset-rahimatanveer1

2025年5月30日

作弊检测数据集CheatingDetectionDataset-rahimatanveer1 数据来源：互联网公开数据标签：作弊检测，数据集，教育，学术诚信，机器学习，数据分析，文本分析，行为分析数据概述：该数据集包含了用于作弊检测的数据，旨在帮助识别和预防学术不端行为。主要特征如下：时间跨度：数据记录的时间范围涵盖了多个学期和考试周期。...

ZIP

阿里与飒达词汇数据集-farismuq2

2025年5月30日

阿里与飒达词汇数据集-farismuq2 数据来源：互联网公开数据标签：词汇分析，数据集，情感分析，自然语言处理，文本挖掘，中文文本，语料库，语言学数据概述：该数据集包含了阿里和飒达相关的词汇，旨在用于词汇分析、情感分析等自然语言处理任务。主要特征如下：时间跨度：数据记录的时间范围不限，涵盖了从早期到现代的词汇。地理范围：...

ZIP

群体行为数据集SwarmBehaviourDataset-aboutakashsah

2025年5月30日

群体行为数据集SwarmBehaviourDataset-aboutakashsah 数据来源：互联网公开数据标签：群体行为，数据集，行为分析，机器学习，动物行为，社会学，数据挖掘，人工智能数据概述：该数据集包含了关于动物群体行为的详细数据，记录了不同物种在各种环境下的群体运动和互动。主要特征如下：...

ZIP

数据2009年知识发现与数据挖掘竞赛KDDCup2009工作数据集-pavanklyan

2025年5月30日

2009年知识发现与数据挖掘竞赛KDDCup2009工作数据集-pavanklyan 数据来源：互联网公开数据标签：数据挖掘，竞赛数据集，用户行为，社交网络，机器学习，推荐系统，用户建模，社交图谱数据概述：该数据集源自2009年知识发现与数据挖掘（KDD）竞赛，旨在促进对用户行为和社交网络的深入理解。主要特征如下：时间跨度：...

ZIP

斯坦福大学自然语言处理课程单词嵌入数据集StanfordNLPCourseWordEmbeddingsDataset-png261

2025年5月30日

斯坦福大学自然语言处理课程单词嵌入数据集StanfordNLPCourseWordEmbeddingsDataset-png261 数据来源：互联网公开数据标签：自然语言处理，词嵌入，数据集，斯坦福大学，文本分析，机器学习，深度学习，语义分析数据概述：...

ZIP

故事数据集StoryDataset-ahmadrezacuet

2025年5月30日

故事数据集StoryDataset-ahmadrezacuet 数据来源：互联网公开数据标签：故事，文本数据，自然语言处理，情感分析，叙事分析，数据集，机器学习，语言模型数据概述：该数据集包含大量故事文本，涵盖多种主题和风格。主要特征如下：时间跨度：数据的时间跨度取决于故事的创作时间，从古代神话传说到现代小说均有收录。...

ZIP

锡尔赫特-纳格里手写体字符识别数据集SylhetiNagriOCRDataset-sushmit0109

2025年5月30日

锡尔赫特-纳格里手写体字符识别数据集SylhetiNagriOCRDataset-sushmit0109 数据来源：互联网公开数据标签：OCR，手写体识别，锡尔赫特语，纳格里文字，数据集，图像识别，自然语言处理，人工智能数据概述：该数据集包含锡尔赫特-纳格里文字的手写体字符图像，旨在用于光学字符识别（OCR）系统的训练和评估。主要特征如下：...

ZIP

在线性别歧视可解释性检测数据集ExplainableDetectionofOnlineSexism-EDOS-maifeeulasad

2025年5月30日

在线性别歧视可解释性检测数据集ExplainableDetectionofOnlineSexism-EDOS-maifeeulasad 数据来源：互联网公开数据标签：性别歧视，自然语言处理，数据集，机器学习，文本分析，情感分析，社交媒体，可解释性数据概述：该数据集主要用于研究和开发在线性别歧视的检测模型，旨在提高模型的可解释性。主要特征如下：...

ZIP

乌兹别克语音识别数据集VoiceRecognitionUzbekDataset-bexruznutfilloyev

2025年5月30日

乌兹别克语音识别数据集VoiceRecognitionUzbekDataset-bexruznutfilloyev 数据来源：互联网公开数据标签：语音识别，乌兹别克语，数据集，自然语言处理，机器学习，语音处理，音频分析，语言学数据概述：该数据集包含乌兹别克语的语音数据，旨在用于语音识别系统的训练和评估。主要特征如下：时间跨度：...

ZIP

英语到印地语翻译数据集English-to-HindiTranslateDataset-saediscrazy

2025年5月30日

英语到印地语翻译数据集English-to-HindiTranslateDataset-saediscrazy 数据来源：互联网公开数据标签：机器翻译，自然语言处理，数据集，印地语，英语，文本翻译，语言模型，多语言数据概述：该数据集包含英语到印地语的翻译文本对，旨在用于机器翻译模型的训练和评估。主要特征如下：时间跨度：...

ZIP

生理信号监测数据集PhysiologicalSignalMonitoringDataset-bestofbests9

2025年5月30日

生理信号监测数据集PhysiologicalSignalMonitoringDataset-bestofbests9 数据来源：互联网公开数据标签：生理信号, 心电图, 呼吸, 血氧饱和度, 临床数据, 生物医学工程, 时间序列分析, 医疗健康数据概述：该数据集包含来自BIDMC数据库的生理信号监测数据，记录了患者的多种生理指标。主要特征如下：...

ZIP

马拉提语文档数据集MarathiDocumentsDataset-ashwanillkagechaad

2025年5月30日

马拉提语文档数据集MarathiDocumentsDataset-ashwanillkagechaad 数据来源：互联网公开数据标签：马拉提语，文档数据集，自然语言处理，机器学习，文本分析，印度文化，学术资源，语言学数据概述：该数据集包含来自多个来源的马拉提语文档，记录了马拉提语的文本数据，适用于自然语言处理、文本分析等任务。主要特征如下：...

ZIP

虚假新闻检测训练数据集FakeNewsDetectionTrainingDataset-shyamgsundhar

2025年5月30日

虚假新闻检测训练数据集FakeNewsDetectionTrainingDataset-shyamgsundhar 数据来源：互联网公开数据标签：虚假新闻，数据集，文本分析，自然语言处理，机器学习，信息检索，新闻报道，舆情分析数据概述：该数据集包含了大量用于虚假新闻检测的文本数据，旨在帮助研究人员和开发者构建和评估虚假新闻检测模型。主要特征如下：...

ZIP

推特文本清洗与展开缩写数据集CleanTweetswithExpandedContractionsDataset-mgmdif

2025年5月30日

推特文本清洗与展开缩写数据集CleanTweetswithExpandedContractionsDataset-mgmdif 数据来源：互联网公开数据标签：推特，文本数据，数据清洗，自然语言处理，缩写展开，情感分析，机器学习，社交媒体数据概述：该数据集包含从推特（Twitter）平台收集的文本数据，并进行了清洗和缩写展开处理。主要特征如下：...

ZIP

用户界面UI代码异味检测数据集-magisni

2025年5月30日

用户界面UI代码异味检测数据集-magisni 数据来源：互联网公开数据标签：用户界面，代码异味，数据集，软件工程，代码分析，机器学习，代码质量，UI设计数据概述：该数据集包含来自用户界面（UI）代码的异味信息，旨在用于UI代码异味检测与分析。主要特征如下：时间跨度：数据记录的时间范围不明确，但涵盖了不同时间段的UI代码。...

ZIP

找到13,254个数据集

注册成功！