找到6,198个数据集

标签: 文本分析

过滤结果
  • WordNet反义词数据集-2006

    2025年4月15日   

    WordNet反义词数据集-2006 数据来源:互联网公开数据 标签:反义词,WordNet,语言学,数据,词典,文本分析,自然语言处理 数据概述: 本数据集包含了从WordNet数据库版本3.0中提取的反义词数据。每个反义词组由至少一个反义词构成,不同反义词组之间用 "|" 分隔,同一组内的反义词用 ";"...
    packageimg
  • 奥本海默电影Reddit讨论数据集

    2025年4月15日   

    奥本海默电影Reddit讨论数据集 数据来源:互联网公开数据 标签:奥本海默电影,克里斯托弗诺兰,Reddit讨论,文本分析,情感分析,评论数据,电影评价 数据概述:...
    packageimg
  • 土耳其谚语与俗语数据集

    2025年4月15日   

    土耳其谚语与俗语数据集 数据来源:互联网公开数据 标签:谚语,俗语,土耳其语言,自然语言处理,NLP,文化研究,文本分析 数据概述:...
    packageimg
  • 国际学习表征会议评审数据集2017

    2025年4月15日   

    国际学习表征会议评审数据集2017 数据来源:互联网公开数据 标签:国际会议,机器学习,学术评审,文本分析,决策过程,性别差异研究 数据概述:...
    packageimg
  • Kickstarter真实世界众筹平台运营项目成功预测建模数据集

    2025年4月15日   

    Kickstarter真实世界众筹平台运营项目成功预测建模数据集 数据来源:互联网公开数据 本数据集基于 Web Robots 提供的公开 Kickstarter 数据,每月通过网络抓取方式生成多个 CSV 文件。数据涵盖 2023 年 11 月、12 月及 2024 年 1 月的全部众筹项目信息,并经过整理、清洗和转换,适用于数据分析与预测建模任务。...
    packageimg
  • 巴西葡萄牙语冒犯性语言识别数据集

    2025年4月15日   

    巴西葡萄牙语冒犯性语言识别数据集 数据来源:互联网公开数据 标签:冒犯性语言,巴西葡萄牙语,多任务注释,社交媒体,自然语言处理,文本分析,内容安全 数据概述:...
    packageimg
  • 情感识别与情感分析数据集2023

    2025年4月15日   

    情感识别与情感分析数据集2023 数据来源:互联网公开数据 标签:情感识别,情感分析,NLP,文本分析,用户生成内容,情绪分类,情感尺度,情感强度,情感正负性,情感控制力度 数据概述: 情感识别与情感分析数据集(EmoBank)是一个大规模的数据集,旨在用于自然语言处理(NLP)领域的 sentiment analysis...
    packageimg
  • 世界各地民间故事与童话数据集

    2025年4月15日   

    世界各地民间故事与童话数据集 数据来源:互联网公开数据 标签:民间故事,童话,文化背景,故事分类,地域,文本分析,故事生成,故事总结 数据概述: 本数据集汇集了来自不同文化背景的民间故事和童话,涵盖了从古代传说到奇幻叙事的各种类型。数据集不仅包括通过口头传统流传的民间故事,还包含由作者创作的童话作品,为研究和探索世界各地的故事文化提供了丰富的资源。...
    packageimg
  • 权力的游戏IMDB用户评论数据集

    2025年4月15日   

    权力的游戏IMDB用户评论数据集 数据来源:互联网公开数据 标签:IMDB,用户评论,权力的游戏,电视节目,文本分析,情感分析,nlp,数据清洗,数据探索 数据概述:...
    packageimg
  • Reddit自杀主题帖文分析数据集-2024年3月更新

    2025年4月15日   

    Reddit自杀主题帖文分析数据集-2024年3月更新 数据来源:互联网公开数据 标签:Reddit,自杀,心理健康,文本分析,情感分析,社交媒体,数据挖掘,自然语言处理,情绪识别,网络社区 数据概述:...
    packageimg
  • BBC新闻多领域新闻文章数据集2022-2024

    2025年4月15日   

    BBC新闻多领域新闻文章数据集2022-2024 数据来源:互联网公开数据 标签:新闻媒体,BBC,文本分析,时间序列,信息传播,舆论分析,数据新闻 数据概述:...
    packageimg
  • 印度垃圾短信分类数据集

    2025年4月15日   

    印度垃圾短信分类数据集 数据来源:互联网公开数据 标签:垃圾短信,印度,短信分类,文本分析,机器学习,数据贡献,通讯模式 数据概述:...
    packageimg
  • WinoBias性别偏见解决Winograd模式数据集

    2025年4月15日   

    WinoBias性别偏见解决Winograd模式数据集 数据来源:互联网公开数据 标签:性别偏见,共指解析,Winograd模式,自然语言处理,计算语言学,文本分析 数据概述:...
    packageimg
  • 印度尼日利亚英文短信垃圾信息数据集

    2025年4月15日   

    印度尼日利亚英文短信垃圾信息数据集 数据来源:互联网公开数据 标签:短信数据,垃圾信息识别,文本分析,自然语言处理,用户行为,数据隐私 数据概述:...
    packageimg
  • 虚假新闻分类数据集2016-2019

    2025年4月15日   

    虚假新闻分类数据集2016-2019 数据来源:互联网公开数据 标签:虚假新闻,新闻分类,新闻来源,文本分析,机器学习,数据标注 数据概述:...
    packageimg
  • 英语词汇综合列表数据集

    2025年4月15日   

    英语词汇综合列表数据集 数据来源:互联网公开数据 标签:英语词汇,自然语言处理,NLP,语言学,词汇库 数据概述: 本数据集包含超过416,000个独特的英语单词,涵盖了广泛的主题和领域,是一个全面的英语词汇列表。该数据集适用于多种自然语言处理任务、语言学研究和其他需要大量英语词汇的应用场景。 数据用途概述:...
    packageimg
  • 福尔摩斯的矛盾增强数据集1963-2021

    2025年4月15日   

    福尔摩斯的矛盾增强数据集1963-2021 数据来源:互联网公开数据 标签:自然语言处理,数据增强,矛盾检测,机器翻译,同义词替换,测试集增强,文本分析 数据概述:...
    packageimg
  • 英语语法错误纠正常用数据集

    2025年4月15日   

    英语语法错误纠正常用数据集 数据来源:互联网公开数据 标签:语法错误,英语学习,自然语言处理,语法纠正,机器学习,文本分析 数据概述: 本数据集是JFLEG(JHU FLuency-Extended...
    packageimg
  • 印尼圣经文本数据集

    2025年4月15日   

    印尼圣经文本数据集 数据来源:互联网公开数据 标签:印尼,圣经,宗教文本,文本分析,语言文化,宗教研究 数据概述: 本数据集包含从互联网公开资源爬取的印尼语圣经文本,内容涵盖圣经的多卷书,包括旧约和新约。数据集以文本形式呈现,适合用于宗教文本研究、语言分析、文化解读等多种场景。 数据用途概述:...
    packageimg
  • 最后生还者社交媒体推文数据集最近

    2025年4月15日   

    最后生还者社交媒体推文数据集最近 数据来源:互联网公开数据 标签:最后生还者,社交媒体,推文,文本分析,互动数据,语言多样性,HBO 数据概述: 本数据集收录了近期与《最后生还者》相关的推文数据,主要围绕TheLastOfUs 和 TheLastOfUsHBO...
    packageimg