找到14,892个数据集

标签: JSON

过滤结果
  • 预处理训练数据数据集-srivignesh

    2025年4月25日   

    预处理训练数据数据集-srivignesh 数据来源:互联网公开数据 标签:机器学习,训练数据,数据集,数据预处理,特征工程,数据清洗,模型训练,人工智能 数据概述:该数据集包含预处理后的训练数据,用于机器学习模型的训练和评估。主要特征如下: 时间跨度:数据记录的时间范围根据原始数据集而定,通常涵盖多个时间段或周期。...
    packageimg
  • 前1000条法律判决书转录文本数据集LJDataFirst1000Transcriptions-manishprajapati24

    2025年4月25日   

    前1000条法律判决书转录文本数据集LJDataFirst1000Transcriptions-manishprajapati24 数据来源:互联网公开数据 标签:法律,判决书,转录文本,自然语言处理,文本分析,数据集,机器学习,司法 数据概述: 该数据集包含前1000条法律判决书的转录文本数据,主要记录了司法判决的详细内容。主要特征如下:...
    packageimg
  • 阿拉伯语讽刺文本数据集-farisalahmdi

    2025年4月25日   

    阿拉伯语讽刺文本数据集-farisalahmdi 数据来源:互联网公开数据 标签:阿拉伯语,讽刺,文本分析,自然语言处理,情感分析,语言学,机器学习,社交媒体 数据概述:该数据集包含了阿拉伯语的讽刺文本数据,主要来源于社交媒体平台,新闻网站等。主要特征如下: 时间跨度:数据记录的时间范围跨度不固定,取决于数据来源。...
    packageimg
  • Reddit社区图书讨论数据集Book-from-RedditDataset-vaishnavibv

    2025年4月25日   

    Reddit社区图书讨论数据集Book-from-RedditDataset-vaishnavibv 数据来源:互联网公开数据 标签:图书,社区讨论,数据集,社交网络,文本分析,用户行为,自然语言处理,情感分析 数据概述: 该数据集包含来自Reddit平台的图书相关讨论数据,记录了用户在图书主题社区中的互动内容。主要特征如下:...
    packageimg
  • 多类别心理健康检测数据集-sidramalikawan

    2025年4月25日   

    多类别心理健康检测数据集-sidramalikawan 数据来源:互联网公开数据 标签:心理健康,情感识别,文本分析,自然语言处理,机器学习,情感分类,健康管理,精神疾病 数据概述: 该数据集包含用于多类别心理健康检测的文本数据,记录了不同个体在社交媒体上的帖子,文章等文本信息,旨在识别和分类用户的心理健康状态。主要特征如下:...
    packageimg
  • 移动端银行客户身份验证数据集MobileBankingCustomerVerificationDataset-antonsh

    2025年4月25日   

    移动端银行客户身份验证数据集MobileBankingCustomerVerificationDataset-antonsh 数据来源:互联网公开数据 标签:银行,客户验证,数据集,移动应用,生物识别,身份识别,机器学习,安全 数据概述: 该数据集包含通过移动应用程序验证新银行客户的数据,记录了客户身份验证过程中的详细信息。主要特征如下:...
    packageimg
  • 批处理输出转换数据集BatchOutputConvertingDataset-lordix

    2025年4月25日   

    批处理输出转换数据集BatchOutputConvertingDataset-lordix 数据来源:互联网公开数据 标签:批处理,数据转换,文件格式,数据处理,机器学习,数据工程,自动化,Python 数据概述: 该数据集包含用于批处理输出转换任务的数据,记录了不同文件格式的转换过程和结果。主要特征如下:...
    packageimg
  • 电影推荐数据集MovieRecommendationData-dostonur

    2025年4月25日   

    电影推荐数据集MovieRecommendationData-dostonur 数据来源:互联网公开数据 标签:电影推荐,数据集,用户行为,协同过滤,机器学习,数据挖掘,娱乐,电影 数据概述: 该数据集包含来自互联网的电影推荐数据,记录了用户对电影的评分,观看历史等信息。主要特征如下: 时间跨度:数据记录的时间范围跨度未知,取决于数据集的原始来源。...
    packageimg
  • 策略问答训练数据集StrategyQATrainDatasetwithLLMs-mahbuburrahman2020

    2025年4月25日   

    策略问答训练数据集StrategyQATrainDatasetwithLLMs-mahbuburrahman2020 数据来源:互联网公开数据 标签:策略问答,数据集,自然语言处理,机器学习,语言模型,训练数据,问答系统,人工智能 数据概述:该数据集包含来自StrategyQA项目的训练数据,用于策略问答系统的训练。主要特征如下:...
    packageimg
  • 谷歌街景图像数据集Caption-StreetviewDataset-nemishmurawat420

    2025年4月25日   

    谷歌街景图像数据集Caption-StreetviewDataset-nemishmurawat420 数据来源:互联网公开数据 标签:街景图像,图像描述,计算机视觉,自然语言处理,数据集,深度学习,图像标注,人工智能 数据概述: 该数据集包含来自谷歌街景的图像数据,并附带相应的图像描述文本,主要用于训练和评估图像描述模型。主要特征如下:...
    packageimg
  • 谷歌图书搜索结果数据集GoogleBooksDataResponseDataset-navyachallagulla

    2025年4月25日   

    谷歌图书搜索结果数据集GoogleBooksDataResponseDataset-navyachallagulla 数据来源:互联网公开数据 标签:图书,搜索,数据集,自然语言处理,文本分析,信息检索,机器学习,学术研究 数据概述: 该数据集包含来自谷歌图书搜索的响应数据,记录了用户在谷歌图书上进行搜索后得到的图书信息。主要特征如下:...
    packageimg
  • Letterboxd电影标题和评论数据集-ecelker

    2025年4月25日   

    Letterboxd电影标题和评论数据集-ecelker 数据来源:互联网公开数据 标签:电影,评论,数据集,文本分析,情感分析,自然语言处理,电影推荐,用户行为 数据概述: 该数据集包含来自Letterboxd网站的电影标题和用户评论数据,记录了用户对电影的评价和观影体验。主要特征如下:...
    packageimg
  • 谷歌搜索信息数据集GoogleSearchInformationDataset-mugentk

    2025年4月25日   

    谷歌搜索信息数据集GoogleSearchInformationDataset-mugentk 数据来源:互联网公开数据 标签:搜索引擎,搜索行为,数据集,自然语言处理,用户行为分析,数据挖掘,信息检索,文本分析 数据概述: 该数据集包含来自谷歌搜索的公开信息,记录了用户的搜索查询,搜索结果,以及相关的用户交互行为。主要特征如下:...
    packageimg
  • 社交媒体用户行为数据集AccioJobMLCapstoneSocialMediaDataset-sirajahmad

    2025年4月25日   

    社交媒体用户行为数据集AccioJobMLCapstoneSocialMediaDataset-sirajahmad 数据来源:互联网公开数据 标签:社交媒体,用户行为,机器学习,文本分析,用户画像,情感分析,数据挖掘,自然语言处理 数据概述:...
    packageimg
  • 大型语言模型训练原始数据集LargeLanguageModelTrainingRawDataset-wanfangyuan

    2025年4月25日   

    大型语言模型训练原始数据集LargeLanguageModelTrainingRawDataset-wanfangyuan 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,深度学习,人工智能,语言模型,文本数据,模型训练 数据概述: 该数据集包含用于训练大型语言模型的原始文本数据,记录了多种来源的文本内容。主要特征如下:...
    packageimg
  • 学术论文文本分析数据集EssayDataset-hienbm02

    2025年4月25日   

    学术论文文本分析数据集EssayDataset-hienbm02 数据来源:互联网公开数据 标签:文本分析,教育研究,数据集,自然语言处理,机器学习,学术写作,文献分析,语言模型 数据概述: 该数据集包含来自学术论文和学术写作的文本数据,记录了学术文献的文本内容和相关特征。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2022年。...
    packageimg
  • 模糊攻击数据集FuzzyAttacksDataset-rabbiazeb

    2025年4月25日   

    模糊攻击数据集FuzzyAttacksDataset-rabbiazeb 数据来源:互联网公开数据 标签:网络安全,数据集,模糊测试,漏洞挖掘,渗透测试,信息安全,漏洞分析,系统安全 数据概述:该数据集包含来自网络安全领域的模糊攻击数据,记录了针对不同软件和系统的模糊测试攻击样本及结果。主要特征如下:...
    packageimg
  • 可穿戴传感器数据数据集WearableSensorDataDataset-oumaymabejaoui

    2025年4月25日   

    可穿戴传感器数据数据集WearableSensorDataDataset-oumaymabejaoui 数据来源:互联网公开数据 标签:可穿戴设备,传感器数据,健康监测,运动分析,机器学习,数据分析,生物医学,物联网 数据概述: 该数据集包含来自可穿戴传感器的数据,记录了佩戴设备用户的生理和运动信息。主要特征如下:...
    packageimg
  • 标注清晰数据集AnnotatedCleanDataset-bf3magic

    2025年4月25日   

    标注清晰数据集AnnotatedCleanDataset-bf3magic 数据来源:互联网公开数据 标签:数据标注,数据集,机器学习,数据清洗,人工智能,自然语言处理,数据科学,数据分析 数据概述: 该数据集包含经过标注和清洗的数据,记录了经过标准化处理的数据样本。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。...
    packageimg
  • 电商用户评论与评分数据集-wajidlinux

    2025年4月25日   

    电商用户评论与评分数据集-wajidlinux 数据来源:互联网公开数据 标签:电商,用户评论,评分,情感分析,文本挖掘,机器学习,自然语言处理,消费者行为 数据概述:该数据集包含来自电商平台的消费者评论文本及其对应的评分数据,记录了用户对商品或服务的评价。主要特征如下: 时间跨度:数据记录的时间范围未知,但包含了大量用户评论。...
    packageimg