找到11,747个数据集

标签: 自然语言处理

过滤结果
  • 尼泊尔语情感分析数据集

    2025年4月14日   

    尼泊尔语情感分析数据集 数据来源:互联网公开数据 标签:尼泊尔语,情感分析,自然语言处理,文本分类,社交媒体分析,机器学习 数据概述:...
    packageimg
  • 常识问答多选题数据集-CommonsenseQA-通用版

    2025年4月14日   

    常识问答多选题数据集-CommonsenseQA-通用版 数据来源:互联网公开数据 标签:常识推理,问答系统,多选题,自然语言处理,机器学习,人工智能,知识图谱 数据概述: 本数据集CommonsenseQA是一个多项选择题问答数据集,旨在考察模型对常识知识的理解和推理能力。 数据集包含12,102个问题,每个问题有一个正确答案和四个干扰选项。...
    packageimg
  • WordNet词汇下位词关系数据集

    2025年4月14日   

    WordNet词汇下位词关系数据集 数据来源:互联网公开数据 标签:WordNet,词汇语义,下位词,语言学,词典,自然语言处理,知识图谱 数据概述: 本数据集包含了从WordNet...
    packageimg
  • 福尔摩斯探案集情感分析数据集19世纪末-20世纪初

    2025年4月14日   

    福尔摩斯探案集情感分析数据集19世纪末-20世纪初 数据来源:互联网公开数据 标签:福尔摩斯探案集,情感分析,文学分析,数据可视化,自然语言处理,读者分析,主题建模 数据概述:...
    packageimg
  • Python代码问答数据集

    2025年4月14日   

    Python代码问答数据集 数据来源:互联网公开数据 标签:Python,代码问答,机器学习,编程教育,自然语言处理,LLM训练 数据概述:...
    packageimg
  • 印度尼西亚语食谱文本数据集2023

    2025年4月14日   

    印度尼西亚语食谱文本数据集2023 数据来源:互联网公开数据 标签:食谱,文本数据,自然语言处理,推荐系统,印尼语,机器学习,数据挖掘 数据概述:...
    packageimg
  • 乌尔都语和英语文本摘要数据集

    2025年4月14日   

    乌尔都语和英语文本摘要数据集 数据来源:互联网公开数据 标签:自然语言处理,摘要生成,乌尔都语,英语,多语言任务,机器学习 数据概述: 本数据集名为“AllDataV1”,专为自然语言处理(NLP)任务设计,特别适用于乌尔都语和英语的抽象摘要任务。数据集包含4,386条记录,共有5个字段,结构清晰,具体内容如下: 1. Unnamed:...
    packageimg
  • 主观问答数据集

    2025年4月14日   

    主观问答数据集 数据来源:互联网公开数据 标签:主观问答,自然语言处理,文本分析,机器学习,教育,培训,数据分析 数据概述: 该数据集包含4118段段落,每段段落配有3个问题和3个答案,形成相关的问答对。数据集以逗号分隔值文件(.csv)的形式存储。这些数据经过手动收集、清理和过滤,旨在为从提供的输入段落中生成抽取式主观问答提供高质量的数据支持。...
    packageimg
  • 土耳其众筹创业项目数据集2022

    2025年4月14日   

    土耳其众筹创业项目数据集2022 数据来源:互联网公开数据 标签:众筹,土耳其,创业项目,资金筹集,项目描述,成功因素,自然语言处理,机器学习 数据概述:...
    packageimg
  • 穆克洛克FOIA数据集

    2025年4月14日   

    穆克洛克FOIA数据集 数据来源:互联网公开数据 标签:穆克洛克,FOIA,政府信息,公共记录,时间序列,数据分析,自然语言处理,机器学习 数据概述:...
    packageimg
  • 谷歌应用商店App评论与下载量分析数据集-2012-2023

    2025年4月14日   

    谷歌应用商店App评论与下载量分析数据集-2012-2023 数据来源:互联网公开数据 标签:应用商店,App评论,下载量,用户行为分析,情感分析,自然语言处理,机器学习,数据挖掘 数据概述: 本数据集包含了2012年至2023年期间,Google...
    packageimg
  • 跨语言文本蕴含关系分类数据集

    2025年4月14日   

    跨语言文本蕴含关系分类数据集 数据来源:互联网公开数据 标签:自然语言处理,跨语言分析,文本蕴含,机器学习,句子分类,逻辑推理,多语言支持 数据概述:...
    packageimg
  • Reddit多任务NLP数据集

    2025年4月14日   

    Reddit多任务NLP数据集 数据来源:互联网公开数据 标签:Reddit,自杀检测,情感分析,多任务学习,自然语言处理 数据概述:...
    packageimg
  • 阿拉伯语-英语句子库25000句

    2025年4月14日   

    阿拉伯语-英语句子库25000句 数据来源:互联网公开数据 标签:阿拉伯语,英语,双语句子,自然语言处理,机器学习,语句类型,多语言理解,教育培训 数据概述: 阿拉伯语-...
    packageimg
  • StackOverflow跨站点问题相似性研究数据集

    2025年4月14日   

    StackOverflow跨站点问题相似性研究数据集 数据来源:互联网公开数据 标签:Stack Overflow,问答社区,问题相似性,跨站点,自然语言处理,文本挖掘,数据分析,软件开发 数据概述: 本数据集包含了Stack Overflow (SO) 以及 Stack Overflow 英文站点 (SOES) 的跨站点问题数据,主要用于研究不同...
    packageimg
  • 模拟城市-建造App用户评论情感分析数据集

    2025年4月14日   

    模拟城市-建造App用户评论情感分析数据集 数据来源:互联网公开数据 标签:App评论,情感分析,用户反馈,模拟城市,游戏,Google Play,自然语言处理,文本分析,用户体验 数据概述: 本数据集收录了来自Google Play商店中模拟城市:建造(SimCity...
    packageimg
  • 比特币推文情感分析数据集

    2025年4月14日   

    比特币推文情感分析数据集 数据来源:互联网公开数据 标签:比特币,推文,情感分析,自然语言处理,机器学习,LLM,数据清洗 数据概述:...
    packageimg
  • 来自Twitter的阿拉伯语讽刺推文数据集

    2025年4月14日   

    来自Twitter的阿拉伯语讽刺推文数据集 数据来源:互联网公开数据 本数据集由 Abufarha 等研究者在 WANLP 2021 Shared Task 中发布,旨在推动阿拉伯语自然语言处理领域中讽刺识别与情感分类任务的研究。项目地址:https://github.com/iabufarha/ArSarcasm-v2 数据内容: 数据集收集自...
    packageimg
  • 姓名与国家来源数据集

    2025年4月14日   

    姓名与国家来源数据集 数据来源:互联网公开数据 标签:姓名,国家,起源,多样性,NLP,自然语言处理,知识图谱,人名识别,文化研究,数据生成 数据概述:...
    packageimg
  • 不适当词汇分类数据集

    2025年4月14日   

    不适当词汇分类数据集 数据来源:互联网公开数据 标签:词汇分类,情感分析,不适当词汇,自然语言处理,英语,Singlish 数据概述: 本数据集包含被分类为正面或负面的词汇列表,所有收录的词汇已经过预处理。数据集中每个词汇附带有情感值,用以描述该词汇是否为不适当的。数据集中的词汇包括英语和Singlish两种语言,为研究和分析词汇情感提供了双语基础。...
    packageimg