找到5,735个数据集

标签: 文本分析

过滤结果
  • 极端天气预警信息分析数据集_Extreme_Weather_Alert_Information_Analysis_Dataset

    2025年6月23日   

    极端天气预警信息分析数据集_Extreme_Weather_Alert_Information_Analysis_Dataset 数据来源:互联网公开数据 标签:天气预警, 自然灾害, 气象数据, 预警信息, 文本分析, 地理信息, 事件检测, 数据挖掘 数据概述:...
    packageimg
  • 希腊议会会议记录文本分析数据集_Greek_Parliament_Proceedings_Text_Analysis_Dataset

    2025年6月23日   

    希腊议会会议记录文本分析数据集_Greek_Parliament_Proceedings_Text_Analysis_Dataset 数据来源:互联网公开数据 标签:议会记录, 文本分析, 希腊, 政治, 文本挖掘, 自然语言处理, 情感分析, 政策研究 数据概述:...
    packageimg
  • 文本评论性别薪酬差异分析数据集_Text_Comments_Gender_Pay_Gap_Analysis

    2025年6月23日   

    文本评论性别薪酬差异分析数据集_Text_Comments_Gender_Pay_Gap_Analysis 数据来源:互联网公开数据 标签:性别歧视, 薪酬差距, 文本分析, 评论数据, 自然语言处理, 情感分析, 数据挖掘, 机器学习 数据概述:...
    packageimg
  • 法国全国大辩论数据集

    2025年6月4日   

    法国全国大辩论数据集 数据来源:互联网公开数据 标签:全国大辩论,法国,公众意见,政策分析,社会研究,文本分析,数据挖掘 数据概述: 本数据集收录了法国“全国大辩论”期间收集的公众意见数据,数据来自https://granddebat.fr/pages/donnees-...
    packageimg
  • 孟加拉语新闻分类数据集1963-2021

    2025年4月14日   

    孟加拉语新闻分类数据集1963-2021 数据来源:互联网公开数据 标签:孟加拉语,新闻分类,NLP,机器学习,文本分析,情感分析,信息检索,语言建模 数据概述: 本数据集收录了来自Jamuna...
    packageimg
  • Steam用户评论数据集精简版

    2025年6月4日   

    Steam用户评论数据集精简版 数据来源:互联网公开数据 标签:游戏评论,玩家行为,用户反馈,数据清洗,文本分析,用户体验,游戏优化 数据概述:...
    packageimg
  • 俄罗斯StackExchange数据集

    2025年6月4日   

    俄罗斯StackExchange数据集 数据来源:互联网公开数据 标签:用户贡献的帖子,问答社区,自然语言处理,信息检索,文本分析,数据挖掘,网络数据 数据概述: 本数据集是匿名化的俄罗斯Stack Exchange用户贡献帖子集合,包含了该平台所有用户生成的内容,涵盖问答、讨论、问题解答等多方面信息。 数据用途概述:...
    packageimg
  • 中国古代文言文与古诗词文本数据集-2020年3月-raynardj

    2025年6月4日   

    中国古代文言文与古诗词文本数据集-2020年3月-raynardj 数据来源:互联网公开数据 标签:文言文,古诗词,中国古代,历史,哲学,语言,文化,数据挖掘,文本分析 数据概述:...
    packageimg
  • 吉吉瓦斯有毒评论分类数据集-2019

    2025年6月4日   

    吉吉瓦斯有毒评论分类数据集-2019 数据来源:互联网公开数据 标签:吉吉瓦斯,有毒评论,自然语言处理,机器学习,偏见检测,评论分类,文本分析,社交媒体 数据概述:...
    packageimg
  • Reddit社群-真实生活-幽默内容互动数据集-2022年4月1日

    2025年6月4日   

    Reddit社群-真实生活-幽默内容互动数据集-2022年4月1日 数据来源:互联网公开数据 标签:Reddit,社交媒体,幽默,文化,情感,网络社区,文本分析,内容分析,meirl,me_irl 数据概述:...
    packageimg
  • 青空文庫日文文学语料库数据集

    2025年6月4日   

    青空文庫日文文学语料库数据集 数据来源:互联网公开数据 标签:日文文学,语料库,文本分析,自然语言处理,教育,文化研究 数据概述: 本数据集是将青空文庫(Aozora Bunko)中收录的日本文学文本编译成更易于使用的CSV格式。包含的经典文学作品涵盖了多个历史时期,为研究日文文本提供了丰富的资源。数据集旨在为研究日文写作和语言学项目提供基础数据支持。...
    packageimg
  • 基于阅读理解的对话关系抽取数据集-QaZre-thedevastator

    2025年6月4日   

    基于阅读理解的对话关系抽取数据集-QaZre-thedevastator 数据来源:互联网公开数据 标签:自然语言处理,关系抽取,阅读理解,知识图谱,对话,机器学习,文本分析 数据概述:...
    packageimg
  • arXiv论文标题摘要与标签数据集

    2025年6月4日   

    arXiv论文标题摘要与标签数据集 数据来源:互联网公开数据 标签:arXiv,科研论文,学术研究,机器学习,数据分类,文本分析,教育 数据概述: 本数据集受到了arXiv论文摘要数据集的启发,可以视为其逻辑扩展。数据集包含536,914篇研究论文的标题和摘要,适用于多标签分类任务。数据通过爬取arXiv官方元数据获取,而非使用原始的arXiv...
    packageimg
  • DAIGT-SaveEverything人工智能生成文本检测数据集2023-chg0901

    2025年6月4日   

    DAIGT-SaveEverything人工智能生成文本检测数据集2023-chg0901 数据来源:互联网公开数据 标签:AI检测,文本分析,机器学习,数据集,生成文本,检测技术,科研,竞赛 数据概述: 本数据集包含使用DAIGT-...
    packageimg
  • IBM专利数据集

    2025年6月4日   

    IBM专利数据集 数据来源:互联网公开数据 标签:专利,IBM,文本分析,技术趋势,行业研究,时间序列,创新驱动 数据概述: 本数据集包含2000年至2019年间IBM在全球范围内获得的专利信息,数据来源于Google...
    packageimg
  • 推特表情符号数据集-2021-mexwell

    2025年6月1日   

    推特表情符号数据集-2021-mexwell 数据来源:互联网公开数据 标签:Twemoji,推特,表情符号,机器学习,数据集,图像识别,文本分析 数据概述:...
    packageimg
  • 社交媒体仇恨言论检测多模态数据集-图文内容-测试与验证

    2025年6月1日   

    社交媒体仇恨言论检测多模态数据集-图文内容-测试与验证 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,图像识别,文本分析,多模态学习,深度学习,图像分类,文本分类,自然语言处理,机器学习,人工智能,内容审核 数据概述:...
    packageimg
  • Kaggle论坛话题标题语义向量数据集

    2025年6月1日   

    Kaggle论坛话题标题语义向量数据集 数据来源:互联网公开数据 标签:Kaggle,论坛,话题,标题,语义,向量,自然语言处理,文本分析,机器学习 数据概述: 本数据集包含了从Kaggle平台上抓取的论坛话题标题,并使用all-...
    packageimg
  • GPT-3Ada嵌入向量评分Jigsaw毒性严重程度数据集-vslaykovsky

    2025年6月1日   

    GPT-3Ada嵌入向量评分Jigsaw毒性严重程度数据集-vslaykovsky 数据来源:互联网公开数据 标签:GPT-3,Ada,嵌入向量,文本分析,挑战数据集,毒性评论,评分,机器学习 数据概述: 本数据集包含使用GPT-3 Ada模型生成的文本嵌入向量,这些向量是针对“Jigsaw Toxic Severity...
    packageimg
  • 维基百科主题与类别数据集

    2025年6月1日   

    维基百科主题与类别数据集 数据来源:互联网公开数据 标签:维基百科,主题标签,类别分类,NLP,文本分析,数据挖掘,知识图谱,元数据,语义分析 数据概述: 本数据集基于维基百科页面标题及其分类信息,包含超过2300万个主题及其相关类别。每个主题(如“Anarchism”)都附带丰富的元数据,包括所属类别(如“Political...
    packageimg