找到5,735个数据集

标签: 文本分析

过滤结果
  • Jigsaw竞赛英语翻译文本数据集

    2025年6月1日   

    Jigsaw竞赛英语翻译文本数据集 数据来源:互联网公开数据 标签:Jigsaw, 翻译, 文本, 英语, 自然语言处理, 文本分析, 机器学习, 竞赛, 负面评论, 错误标识 数据概述:...
    packageimg
  • 新闻主题预测数据集

    2025年6月1日   

    新闻主题预测数据集 数据来源:互联网公开数据 标签:新闻,主题预测,体育,文化,经济,时间序列,文本分析 数据概述: 本数据集收录了2019年至2023年间来自俄罗斯新闻网站lenta.ru的新闻数据,涵盖体育、文化、经济等多个领域。数据集包含新闻标题、正文内容、发布时间及主题标签等字段,为新闻主题预测任务提供了高质量的数据支持。 数据用途概述:...
    packageimg
  • 安然公司员工电子邮件数据集-合规性审计与风险分析-2000-2002

    2025年6月1日   

    安然公司员工电子邮件数据集-合规性审计与风险分析-2000-2002 数据来源:互联网公开数据 标签:安然公司,电子邮件,合规性,风险管理,审计,金融,通信,文本分析,历史数据 数据概述:...
    packageimg
  • YouTube游戏和应用中虚拟形象视频转录文本数据集

    2025年6月1日   

    YouTube游戏和应用中虚拟形象视频转录文本数据集 数据来源:互联网公开数据 标签:YouTube,视频转录,虚拟形象,游戏,应用,自然语言处理,文本分析,情感分析 数据概述: 本数据集包含从YouTube视频中提取的音频转录文本。视频地址通过youtube-data-...
    packageimg
  • 亚马逊音乐仪器评论数据集

    2025年6月1日   

    亚马逊音乐仪器评论数据集 数据来源:互联网公开数据 标签:亚马逊评论,音乐仪器,自然语言处理,情感分析,数据挖掘,机器学习,文本分析 数据概述:...
    packageimg
  • 移动应用商店应用描述文本分析数据集-sagol79

    2025年6月1日   

    移动应用商店应用描述文本分析数据集-sagol79 数据来源:互联网公开数据 标签:移动应用,应用描述,文本分析,自然语言处理,机器学习,应用商店,文本挖掘,NLP,应用分类 数据概述:...
    packageimg
  • Reddit论坛用户评论与回复关系数据集-2007-2014

    2025年6月1日   

    Reddit论坛用户评论与回复关系数据集-2007-2014 数据来源:互联网公开数据 标签:Reddit, 论坛, 评论, 回复, 社交媒体, 自然语言处理, 文本分析, 关键词提取 数据概述: 本数据集包含从 2007 年至 2014 年间,Reddit 论坛上随机抽取的 400...
    packageimg
  • 雅虎问答10类别NLP数据集

    2025年6月1日   

    雅虎问答10类别NLP数据集 数据来源:互联网公开数据 标签:问答分类,自然语言处理,NLP,文本分类,问答系统,文本分析,机器学习,主题分类 数据概述:...
    packageimg
  • 古腾堡诗歌项目诗歌文本数据集-terminate9298

    2025年6月1日   

    古腾堡诗歌项目诗歌文本数据集-terminate9298 数据来源:互联网公开数据 标签:诗歌,文学,文本,古腾堡项目,语料库,自然语言处理,文本分析,诗歌创作,情感分析 数据概述: 本数据集收录了来自古腾堡项目(Gutenberg Project)的诗歌文本,包含2703086行句子。数据集由Allison...
    packageimg
  • 德国新闻文章内容分类数据集-dirkbahle

    2025年6月1日   

    德国新闻文章内容分类数据集-dirkbahle 数据来源:互联网公开数据 标签:德国新闻,新闻文章,文本分析,自然语言处理,内容分类,新闻爬取,文本数据,时事新闻 数据概述:...
    packageimg
  • 土耳其语恶意言论检测数据集-baalawi1

    2025年6月1日   

    土耳其语恶意言论检测数据集-baalawi1 数据来源:互联网公开数据 标签:土耳其语,恶意言论,文本分析,自然语言处理,情感分析,机器学习,BERT 数据概述: 本数据集旨在用于训练土耳其语恶意言论检测模型。 数据集包含土耳其语文本,并附带了基于BERT模型提取的特征。...
    packageimg
  • 越南诗歌创作风格数据集-phamtuyet

    2025年6月1日   

    越南诗歌创作风格数据集-phamtuyet 数据来源:互联网公开数据 标签:诗歌,越南,文学,创作风格,诗词,文本分析,六字诗,七字诗,四字诗,八字诗,五字诗,双七言,六八体 数据概述: 本数据集收录了越南诗歌作品,涵盖多种诗歌创作风格。 数据集包含了不同长度和韵律的诗歌,包括六字诗、双七言、四字诗、七字诗、六八体、五字诗和八字诗等。...
    packageimg
  • 梵文关系数据集

    2025年6月1日   

    梵文关系数据集 数据来源:互联网公开数据 标签:梵文,句法分析,语料库,关系数据,NLP,语言学研究,文本分析 数据概述: 本数据集基于CoNLL-U格式文件构建,将原始的结构化文本数据转换为关系型数据格式,并存储为 Feather 文件以提高数据处理的效率和灵活性。数据集包含两个主要文件:words.feather 和...
    packageimg
  • 网络流行语词典数据集-2021年

    2025年6月1日   

    网络流行语词典数据集-2021年 数据来源:互联网公开数据 标签:流行语,网络语言,词典,文本分析,自然语言处理,数据挖掘,社会学研究 数据概述: 本数据集包含截至2021年6月1日Urban...
    packageimg
  • 法律文本知识库数据集

    2025年6月1日   

    法律文本知识库数据集 数据来源:互联网公开数据 标签:法律文本,知识库,自然语言处理,文本挖掘,法律信息,文本分析 数据概述:...
    packageimg
  • 雅虎问答综合问答数据集-2000至2010年

    2025年6月1日   

    雅虎问答综合问答数据集-2000至2010年 数据来源:互联网公开数据 标签:雅虎问答,综合问答,数据集,机器学习,分类,文本分析,自然语言处理,大型数据集 数据概述:...
    packageimg
  • 纽约时报文章内容分析精简版数据集-2007-2017

    2025年6月1日   

    纽约时报文章内容分析精简版数据集-2007-2017 数据来源:互联网公开数据 标签:纽约时报,文章,新闻,文本分析,聚类,主题建模,情感分析 数据概述:...
    packageimg
  • Coursera数据科学专项课程数据集-文本内容分析-英语语料库

    2025年6月1日   

    Coursera数据科学专项课程数据集-文本内容分析-英语语料库 数据来源:互联网公开数据 标签:自然语言处理,文本分析,机器学习,语料库,Coursera,博客,新闻,推特,英语,数据科学 数据概述: 本数据集是Coursera数据科学专项课程的Capstone项目所使用的数据集,其语料库来源于HC...
    packageimg
  • 全球RSS新闻数据集

    2025年6月1日   

    全球RSS新闻数据集 数据来源:互联网公开数据 标签:RSS,新闻,内容聚合,文本分析,数据挖掘,机器学习 数据概述:...
    packageimg
  • TensorFlow2-0问答数据集简化版-问答数据

    2025年6月1日   

    TensorFlow2-0问答数据集简化版-问答数据 数据来源:互联网公开数据 标签:TensorFlow,问答,自然语言处理,机器学习,数据集,文本分析,简化版 数据概述: 本数据集基于TensorFlow...
    packageimg