找到11,761个数据集

标签: 自然语言处理

过滤结果
  • 评论与变量数据集

    2025年4月18日   

    评论与变量数据集 数据来源:互联网公开数据 标签:评论,变量,文本分析,情感分析,自然语言处理,用户行为,产品评价 数据概述:...
    packageimg
  • Tarjoman波斯语文本数据集

    2025年4月18日   

    Tarjoman波斯语文本数据集 数据来源:互联网公开数据 标签:波斯语,文本爬取,新闻文章,语料库,文本分析,自然语言处理,机器学习 数据概述:...
    packageimg
  • 俄罗斯法制文本平行语料库2008-2022

    2025年4月18日   

    俄罗斯法制文本平行语料库2008-2022 数据来源:互联网公开数据 标签:俄罗斯法律,文本简化,平行语料库,法律文本,自然语言处理,法律历史,动态主题建模 数据概述: 本数据集收录了2008年12月31日至2022年11月28日期间的俄罗斯法制文本及其简化版本,包含2963对原始文档和简化文档。数据来源于俄罗斯政府官方报纸Rossiyskaya...
    packageimg
  • 新闻真伪识别数据集-涵盖多种来源与真实新闻对比

    2025年4月18日   

    新闻真伪识别数据集-涵盖多种来源与真实新闻对比 数据来源:互联网公开数据 标签:新闻,真伪,假新闻,真实新闻,文本分类,机器学习,自然语言处理,舆情分析 数据概述: 本数据集整合了来自不同来源的新闻文章,经过清洗和特征工程处理,用于新闻真伪识别研究。数据集包含新闻文本及其对应的标签,标签分为两类:0代表假新闻,1代表真实新闻。 数据用途概述:...
    packageimg
  • Twitter社交媒体情感分析数据集-300万条已标注推文

    2025年4月18日   

    Twitter社交媒体情感分析数据集-300万条已标注推文 数据来源:互联网公开数据 标签:Twitter,社交媒体,情感分析,情绪分类,文本数据,自然语言处理,情感,观点挖掘 数据概述:...
    packageimg
  • IMDB电影评论二元情感分析数据集

    2025年4月18日   

    IMDB电影评论二元情感分析数据集 数据来源:互联网公开数据 标签:电影评论,情感分析,二元分类,自然语言处理,数据标注,文本分析 数据概述: 本数据集包含精选自IMDB(Internet Movie...
    packageimg
  • TED演讲文本主题分析与文本分割数据集-2020年5月1日

    2025年4月18日   

    TED演讲文本主题分析与文本分割数据集-2020年5月1日 数据来源:互联网公开数据 标签:TED演讲,文本,演讲,文本分割,自然语言处理,机器学习,主题分析,演讲稿,NLP 数据概述: 本数据集包含了从TED.com网站抓取的TED演讲稿文本,每个演讲稿被分割成段落。演讲视频列表来源于“TED Talks Transcripts for...
    packageimg
  • Airbnb房源评论文本情感分析数据集-全球房源评论数据

    2025年4月18日   

    Airbnb房源评论文本情感分析数据集-全球房源评论数据 数据来源:互联网公开数据 标签:Airbnb,房源评论,文本数据,情感分析,自然语言处理,文本挖掘,用户反馈,住宿体验 数据概述:...
    packageimg
  • 基于CoSQL的跨领域对话式文本转SQL数据集

    2025年4月18日   

    基于CoSQL的跨领域对话式文本转SQL数据集 数据来源:互联网公开数据 标签:自然语言处理,文本转SQL,对话系统,数据库查询,语义解析,对话状态跟踪,对话生成,对话行为预测 数据概述: CoSQL(Conversational text-to-...
    packageimg
  • MetaMathQA数学问题问答数据集Mistral-7B模型性能评估

    2025年4月18日   

    MetaMathQA数学问题问答数据集Mistral-7B模型性能评估 数据来源:互联网公开数据 标签:数学,问答系统,自然语言处理,Mistral-7B,模型评估,机器学习,数据集,NLP 数据概述: 本数据集包含了由Mistral-7B问答系统生成的数学问题及其对应的回答。数据主要用于评估和提升MetaMathQA(MetaMath...
    packageimg
  • 非洲尼日利亚口音语音数据集

    2025年4月18日   

    非洲尼日利亚口音语音数据集 数据来源:互联网公开数据 标签:尼日利亚,语音,口音,语言技术,语音识别,自然语言处理,语音合成 数据概述:...
    packageimg
  • 苹果公司股票历史财务新闻数据集2016-2024

    2025年4月18日   

    苹果公司股票历史财务新闻数据集2016-2024 数据来源:互联网公开数据 标签:苹果公司,股票,AAPL,历史数据,财务新闻,自然语言处理,市场分析,投资趋势,新闻情感分析 数据概述:...
    packageimg
  • Kaggle反馈竞赛修正训练集-文本标注数据集

    2025年4月18日   

    Kaggle反馈竞赛修正训练集-文本标注数据集 数据来源:互联网公开数据 标签:文本分析,自然语言处理,标注数据,竞赛,反馈,文本纠错,机器学习,NLP 数据概述: 本数据集是针对Kaggle反馈竞赛(Feedback...
    packageimg
  • 亚马逊美国软件类商品评论数据集

    2025年4月18日   

    亚马逊美国软件类商品评论数据集 数据来源:互联网公开数据 标签:亚马逊评论,软件产品,用户反馈,情感分析,数据挖掘,自然语言处理,电子商务分析 数据概述: 本数据集来自TensorFlow...
    packageimg
  • 自然语言处理新闻真伪识别数据集

    2025年4月18日   

    自然语言处理新闻真伪识别数据集 数据来源:互联网公开数据 标签:自然语言处理, 文本分类, 虚假新闻, 真实新闻, 新闻分析, 机器学习, 文本数据 数据概述: 本数据集包含用于新闻真伪识别的文本数据,主要用于自然语言处理(NLP)相关研究。...
    packageimg
  • GitHub问题预测挑战赛问题类型预测数据集

    2025年4月18日   

    GitHub问题预测挑战赛问题类型预测数据集 数据来源:互联网公开数据 标签:GitHub,问题预测,文本分类,自然语言处理,机器学习,代码缺陷,软件开发,NLP,BERT 数据概述:...
    packageimg
  • 对话与文学风格文本数据集

    2025年4月18日   

    对话与文学风格文本数据集 数据来源:互联网公开数据 标签:对话风格,文学风格,文本风格转换,俄语数据,自然语言处理,机器学习,语言模型 数据概述:...
    packageimg
  • Enron邮件数据集垃圾邮件与非垃圾邮件分类数据集

    2025年4月17日   

    Enron邮件数据集垃圾邮件与非垃圾邮件分类数据集 数据来源:互联网公开数据 标签:邮件,Enron,垃圾邮件,非垃圾邮件,文本分类,自然语言处理,数据清洗,邮件分析 数据概述:...
    packageimg
  • 俄罗斯动漫评论数据集

    2025年4月17日   

    俄罗斯动漫评论数据集 数据来源:互联网公开数据 标签:俄罗斯,动漫评论,情感分析,文本分析,机器学习,自然语言处理 数据概述: 本数据集是首个针对俄罗斯动漫评论的情感分析数据集,包含约8万条评论数据。评论内容覆盖了多种动漫类型及其相关讨论,反映了俄罗斯动漫爱好者对不同作品的评价和态度。数据集中的每条评论均经过清洗和标准化处理,确保数据质量和适用性。...
    packageimg
  • IMDB电影评论数据集1963-2021

    2025年4月17日   

    IMDB电影评论数据集1963-2021 数据来源:互联网公开数据 标签:IMDB,电影评论,自然语言处理,情感分析,文本数据 数据概述:...
    packageimg