找到5,803个数据集

标签: 文本分析

过滤结果
  • TREC问题分类数据集

    2025年4月15日   

    TREC问题分类数据集 数据来源:互联网公开数据 标签:问题分类,机器学习,自然语言处理,信息检索,数据集,文本分析,学术研究 数据概述:...
    packageimg
  • 电影数据分析与自然语言处理实践数据集-TMDB电影数据-时间不限

    2025年4月15日   

    电影数据分析与自然语言处理实践数据集-TMDB电影数据-时间不限 数据来源:互联网公开数据 标签:电影,TMDB,电影数据,NLP,自然语言处理,文本分析,情感分析,数据预处理,文本清洗,机器学习 数据概述: 本数据集包含了TMDB(The Movie...
    packageimg
  • 图书分类与评分预测数据集

    2025年4月15日   

    图书分类与评分预测数据集 数据来源:互联网公开数据 标签:图书分类, 文本分析, 评分预测, 自然语言处理, 数据挖掘, 书籍推荐, 作者影响力, 清新阅读 数据概述:...
    packageimg
  • 权力的游戏Reddit社区讨论内容数据集

    2025年4月15日   

    权力的游戏Reddit社区讨论内容数据集 数据来源:互联网公开数据 标签:权力的游戏,Reddit,社交媒体,讨论,评论,帖子,文本分析,情感分析 数据概述: 本数据集收录了从Reddit社交平台r/gameofthrones子版块抓取的全部帖子和评论数据。数据通过Reddit...
    packageimg
  • 西班牙语书籍语料库

    2025年4月15日   

    西班牙语书籍语料库 数据来源:互联网公开数据 标签:西班牙语,语料库,文本分析,词性标注,儿童文学,成人文学,词频统计,文本边界分析 数据概述:...
    packageimg
  • 社区电视节目台词数据集1963-2021

    2025年4月15日   

    社区电视节目台词数据集1963-2021 数据来源:互联网公开数据 标签:社区电视节目,台词,语言模型,文本分析,电视剧研究,文化研究,历史背景 数据概述: 本数据集收录了某社区电视节目的全部台词记录,涵盖了从1963年至2021年间的多个季度和剧集。数据集通过网络爬虫技术收集,为研究该节目提供了全面的台词文本资料,适合进行语言模型训练和文本分析。...
    packageimg
  • Reddit食谱分享与互动分析数据集

    2025年4月15日   

    Reddit食谱分享与互动分析数据集 数据来源:互联网公开数据 标签:食谱,Reddit,社交媒体,文本分析,NLP,烹饪,菜谱,用户互动,数据挖掘 数据概述:...
    packageimg
  • 社交媒体侮辱言论数据集

    2025年4月15日   

    社交媒体侮辱言论数据集 数据来源:互联网公开数据 标签:社交媒体,侮辱言论,文本分析,自然语言处理,情感分析,评论文本 数据概述:...
    packageimg
  • Commonlit阅读理解文章难度评估数据集-2020年8月

    2025年4月15日   

    Commonlit阅读理解文章难度评估数据集-2020年8月 数据来源:互联网公开数据 标签:阅读理解,文本分析,教育,自然语言处理,阅读难度,文本数据,Commonlit,机器学习 数据概述:...
    packageimg
  • Reddit读书建议社区书籍推荐数据集-时间跨度待定

    2025年4月15日   

    Reddit读书建议社区书籍推荐数据集-时间跨度待定 数据来源:互联网公开数据 标签:书籍推荐, Reddit, 社交媒体, 文本分析, 自然语言处理, 情感分析, 图书评论, 读者互动 数据概述: 本数据集来源于Reddit社交平台上的r/booksuggestions子版块,该版块汇集了用户关于书籍的讨论与推荐。数据通过Python Reddit...
    packageimg
  • NASA天文学图片每日一图数据集

    2025年4月15日   

    NASA天文学图片每日一图数据集 数据来源:互联网公开数据 标签:NASA,天文学,图片,每日一图,教育,研究,图像处理,文本分析,关键词提取,实体识别 数据概述: 本数据集包含了NASA自1995年6月以来在其“Astronomy Picture of the...
    packageimg
  • Reddit社区自杀风险帖子检测数据集

    2025年4月15日   

    Reddit社区自杀风险帖子检测数据集 数据来源:互联网公开数据 标签:Reddit,自杀,心理健康,文本分析,情感分析,社交媒体,风险评估,自然语言处理 数据概述:...
    packageimg
  • 中文有毒语言数据集

    2025年4月15日   

    中文有毒语言数据集 数据来源:互联网公开数据 标签:中文,有毒语言,文本分析,机器学习,自然语言处理,伦理问题,多级分类,基准测试 数据概述:...
    packageimg
  • Reddit谎言推特谎言信息传播分析数据集-每周更新

    2025年4月15日   

    Reddit谎言推特谎言信息传播分析数据集-每周更新 数据来源:互联网公开数据 标签:推特,社交媒体,谎言,Reddit,信息传播,时间序列,文本分析 数据概述:...
    packageimg
  • 美剧办公室演员解说播客节目文本数据集

    2025年4月15日   

    美剧办公室演员解说播客节目文本数据集 数据来源:互联网公开数据 标签:播客,剧本,喜剧,办公室,文化,娱乐,音频,文本分析 数据概述: 本数据集包含美国知名情景喜剧《办公室》两位主演Jenna Fischer和Angela Kinsey主持的播客节目《Office...
    packageimg
  • 大英百科全书文章标题数据集

    2025年4月15日   

    大英百科全书文章标题数据集 数据来源:互联网公开数据 标签:大英百科全书,文章标题,科技,艺术,文本分类,NLP,文本分析 数据概述: 本数据集收录了大英百科全书中的“艺术与科技”类目下的文章标题,通过大英百科全书API创建。未来版本将增加其他文章类别。数据集为进行文本分类、自然语言处理(NLP)任务和文本分析提供了丰富的标题样本。 数据用途概述:...
    packageimg
  • 推特文本情感分析-种族歧视与非歧视推文分类数据集

    2025年4月15日   

    推特文本情感分析-种族歧视与非歧视推文分类数据集 数据来源:互联网公开数据 标签:推特,文本分析,情感分析,种族歧视,自然语言处理,社交媒体,文本分类,机器学习 数据概述: 本数据集包含推特推文数据,用于种族歧视与非种族歧视言论的分类研究。...
    packageimg
  • 全球高评分电影字幕数据-电影列表字幕文件

    2025年4月15日   

    全球高评分电影字幕数据-电影列表字幕文件 数据来源:互联网公开数据 标签:电影,评分,字幕,影视,娱乐,文化,语言,文本分析,数据挖掘 数据概述:...
    packageimg
  • 泽伦斯基推特数据集2019年至今

    2025年4月15日   

    泽伦斯基推特数据集2019年至今 数据来源:互联网公开数据 标签:泽伦斯基,推特,文本分析,乌克兰政治,言论分析,社交媒体 数据概述: 本数据集包含了2019年至今乌克兰总统泽连斯基在推特平台上发布的所有推文。数据按发布日期降序排列,涵盖了总统的言论内容,为分析其言论风格、政治立场及公众沟通方式提供了丰富的文本材料。 数据用途概述:...
    packageimg
  • 写作过程链接数据集

    2025年4月15日   

    写作过程链接数据集 数据来源:互联网公开数据 标签:写作过程,写作质量,比赛数据,文本分析,教育研究,写作训练,数据分析 数据概述:...
    packageimg