找到9,979个数据集

标签: AI开发

过滤结果
  • 数学问题数据集用于微调1963-2021

    2025年4月14日   

    数学问题数据集用于微调1963-2021 数据来源:互联网公开数据 标签:数学问题,数据集微调,机器学习,教育,培训,人工智能 数据概述: 本数据集由“Mathematical Problems Dataset:...
    packageimg
  • 古吉拉特语电影评论情感分析数据集

    2025年4月14日   

    古吉拉特语电影评论情感分析数据集 数据来源:互联网公开数据 标签:古吉拉特语,电影评论,情感分析,自然语言处理,文本分析 数据概述: 该数据集收录了453篇用古吉拉特语撰写的电影评论,涵盖了积极、消极和中性三种情感类别。数据集详细记录了每条评论的文本内容、对应的情感标签及评论中使用的单词数量,为情感分析提供了宝贵的语言样本。 数据用途概述:...
    packageimg
  • 蛋白质与RNA研究文本数据集2023

    2025年4月14日   

    蛋白质与RNA研究文本数据集2023 数据来源:互联网公开数据 标签:蛋白质, RNA, 医学研究, 数据挖掘, 机器学习, 语言模型, 生物信息学, 药物开发, 疫苗研究 数据概述: 本数据集包含从Wikipedia...
    packageimg
  • 蛋白质二级结构预测基准数据集CASP12-CB513-TS115

    2025年4月14日   

    蛋白质二级结构预测基准数据集CASP12-CB513-TS115 数据来源:互联网公开数据 标签:蛋白质,二级结构,生物信息学,机器学习,结构预测,三态分类,八态分类 数据概述:...
    packageimg
  • 量子决策模拟数据集1963-2021

    2025年4月14日   

    量子决策模拟数据集1963-2021 数据来源:互联网公开数据 标签:量子计算,决策模拟,量子态,环境变量,量子纠缠,概率预测,机器学习 数据概述: 本数据集是一个合成的量子决策模拟数据集,旨在探索量子态、环境变量和决策过程在理论或模拟环境中的相互作用。该数据集不是基于真实世界数据生成的,而是为了反映受控实验环境中可能的结果而创建的。...
    packageimg
  • OpenHand手势识别数据集-手部动作识别-2024

    2025年4月14日   

    OpenHand手势识别数据集-手部动作识别-2024 数据来源:互联网公开数据 标签:手势识别,计算机视觉,OpenHand,OpenPose,手部姿态,机器学习,深度学习,动作识别,人工智能,图像数据 数据概述:...
    packageimg
  • 手写数字识别数据集1963-2021

    2025年4月14日   

    手写数字识别数据集1963-2021 数据来源:互联网公开数据 标签:手写数字,图像识别,机器学习,像素数据,数据分类 数据概述: 本数据集包含48,000个手写数字的图像,每个图像被转换为785个像素值的向量(包括一个标签列)。数据集中的每个数字图像代表0至9之间的整数,适用于图像识别和分类任务。 数据用途概述:...
    packageimg
  • 安全离线检索增强系统数据集

    2025年4月14日   

    安全离线检索增强系统数据集 数据来源:互联网公开数据 标签:离线RAG系统,数据隐私,大语言模型,开源技术,嵌入创建,聊天检索,MIT许可证 数据概述:...
    packageimg
  • 视频游戏聊天机器人数据集2023

    2025年4月14日   

    视频游戏聊天机器人数据集2023 数据来源:互联网公开数据 标签:视频游戏,聊天机器人,数据生成,自然语言处理,游戏对话,数据-to-text,游戏推荐 数据概述:...
    packageimg
  • Twitch聊天数据集-健康游戏GG频道-2023年

    2025年4月14日   

    Twitch聊天数据集-健康游戏GG频道-2023年 数据来源:互联网公开数据 标签:Twitch,聊天数据,健康游戏GG,直播数据,数据科学,教育,可视化 数据概述:...
    packageimg
  • FACENS自然语言处理分类训练数据集

    2025年4月14日   

    FACENS自然语言处理分类训练数据集 数据来源:互联网公开数据 标签:自然语言处理,分类,训练数据,文本分析,FACENS,数据科学 数据概述:...
    packageimg
  • 英伊博对照词典数据集

    2025年4月14日   

    英伊博对照词典数据集 数据来源:互联网公开数据 标签:英伊博翻译,词典,机器翻译,语言学,文本翻译 数据概述: 本数据集用于英伊博机器翻译,包含从英伊博翻译词典网站抓取的文本文件。数据集包括英文单词和对应的伊博文单词,并以CSV文件的形式提供了双语对照表,为英伊博翻译任务提供了基础数据支持。 数据用途概述:...
    packageimg
  • 乌尔都语评论情感分类数据集

    2025年4月14日   

    乌尔都语评论情感分类数据集 数据来源:互联网公开数据 标签:乌尔都语,评论,情感分析,自然语言处理,NLP,社交媒体 数据概述:...
    packageimg
  • 语音助手消息类型分类数据集

    2025年4月14日   

    语音助手消息类型分类数据集 数据来源:互联网公开数据 标签:消息类型,语音助手,自然语言处理,分类模型,问答系统,人机交互 数据概述: 本数据集包含基于消息类型的分类数据,涵盖了四种主要类型:Yes/No问题(yn)、Wh-...
    packageimg
  • 洋葱新闻数据集

    2025年4月14日   

    洋葱新闻数据集 数据来源:互联网公开数据 标签:洋葱新闻,真实新闻,文本分类,机器学习,自然语言处理,数据集,新闻真实性 数据概述: 本数据集包含《The Onion》发布的假新闻文章和来自Reddit论坛r/NotTheOnion的真实“洋葱式”新闻文章。《The...
    packageimg
  • 文本编辑数据集

    2025年4月14日   

    文本编辑数据集 数据来源:互联网公开数据 标签:文本编辑,机器学习,自然语言处理,语法检查,语言模型,训练数据,数据标注 数据概述:...
    packageimg
  • 数据预处理入门教程数据集

    2025年4月14日   

    数据预处理入门教程数据集 数据来源:互联网公开数据 标签:数据预处理,入门教程,数据清洗,缺失值处理,特征缩放,分类变量编码,机器学习,数据科学 数据概述:...
    packageimg
  • PII数据检测与生成数据集

    2025年4月14日   

    PII数据检测与生成数据集 数据来源:互联网公开数据 标签:PII检测,数据生成,Gemini API,数据安全,机器学习,自然语言处理 数据概述: 本数据集通过Gemini...
    packageimg
  • 印度消费者COVID-19文章问答数据集2021

    2025年4月14日   

    印度消费者COVID-19文章问答数据集2021 数据来源:互联网公开数据 标签:COVID-19,问答系统,消费者信息,医学研究,专家问答,时间序列,健康信息 数据概述: 本数据集旨在应对COVID-19疫情,包含两大类文章:研究文章和消费者文章。研究文章来自COVID-19开放研究数据集挑战(CORD-19),涵盖PubMed...
    packageimg
  • IBM辩论者和规则标记演讲中被强调的词语数据集

    2025年4月14日   

    IBM辩论者和规则标记演讲中被强调的词语数据集 数据来源:互联网公开数据 标签:IBM,辩论,演讲,文本标注,强调词语,自然语言处理,语音分析 数据概述:...
    packageimg