找到5,798个数据集

标签: 文本分析

过滤结果
  • 社交媒体仇恨言论识别数据集-文本内容-2017

    2025年4月14日   

    社交媒体仇恨言论识别数据集-文本内容-2017 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,情感分析,自然语言处理,语言学,数据标注,分类,攻击性语言 数据概述: 本数据集包含近1.5万条短文本,每条文本均由多位贡献者进行标注,以识别其是否包含仇恨言论。标注结果分为三类:a) 包含仇恨言论;b) 具有攻击性,但不属于仇恨言论;c)...
    packageimg
  • 伊斯兰国宗教文本数据集2014-2017

    2025年4月14日   

    伊斯兰国宗教文本数据集2014-2017 数据来源:互联网公开数据 标签:伊斯兰国,宗教文本,宣传材料,招募,意识形态,反恐研究,文本分析 数据概述:...
    packageimg
  • 奥罗莫语句子标注数据集

    2025年4月14日   

    奥罗莫语句子标注数据集 数据来源:互联网公开数据 标签:奥罗莫语,句子标注,自然语言处理,文本分析,语言识别 数据概述: 本数据集包含78,000条经过清理的奥罗莫语句子,所有句子均无特殊字符和标点符号。数据集由两列组成,其中一列包含句子文本,另一列包含对应的语言标签。该数据集为研究和处理奥罗莫语提供了丰富的语言素材。 数据用途概述:...
    packageimg
  • 贝叶斯方法与机器学习书籍主题建模数据集

    2025年4月14日   

    贝叶斯方法与机器学习书籍主题建模数据集 数据来源:互联网公开数据 标签:机器学习,贝叶斯方法,主题建模,文本分析,自然语言处理,书籍,数据挖掘,Bishop 数据概述: 本数据集包含了《模式识别与机器学习》(Pattern Recognition and Machine Learning)一书(作者:Christopher...
    packageimg
  • 不明飞行物目击事件词序模式数据集

    2025年4月14日   

    不明飞行物目击事件词序模式数据集 数据来源:互联网公开数据 标签:不明飞行物,词序模式,NLP,文本分析,UFO,目击报告,模式识别 数据概述: 本数据集来源于NUFORC的不明飞行物目击事件数据库,包含了通过https://github.com/jacksonkarel/nlp-...
    packageimg
  • 推特用户情感分析数据集-社交媒体内容情感分类-多实体-训练验证

    2025年4月14日   

    推特用户情感分析数据集-社交媒体内容情感分类-多实体-训练验证 数据来源:互联网公开数据 标签:推特,情感分析,自然语言处理,社交媒体,情感分类,机器学习,文本分析,训练集,验证集 数据概述: 本数据集用于推特(Twitter)用户情感分析,旨在对推特消息中针对特定实体的情感倾向进行分类。...
    packageimg
  • 表情符号描述与释义数据集

    2025年4月14日   

    表情符号描述与释义数据集 数据来源:互联网公开数据 标签:表情符号,Emoji,释义,情感分析,文本分析,社交媒体,符号学,数据挖掘 数据概述:...
    packageimg
  • 在线新闻文章分享量预测数据集-Mashable平台-2015年

    2025年4月14日   

    在线新闻文章分享量预测数据集-Mashable平台-2015年 数据来源:互联网公开数据 标签:新闻,社交媒体,文章,分享量,预测,机器学习,文本分析,Mashable,内容分析 数据概述:...
    packageimg
  • 斯坦福问答数据集SQuAD泰米尔语翻译数据集-问答对-泰米尔语-

    2025年4月14日   

    斯坦福问答数据集SQuAD泰米尔语翻译数据集-问答对-泰米尔语- 数据来源:互联网公开数据 标签:问答,SQuAD,泰米尔语,自然语言处理,机器翻译,文本分析,数据集,翻译 数据概述: 本数据集是针对“chaii -...
    packageimg
  • 英超梦幻联赛Reddit社区讨论内容数据集

    2025年4月14日   

    英超梦幻联赛Reddit社区讨论内容数据集 数据来源:互联网公开数据 标签:足球,英超,梦幻联赛,Reddit,社交媒体,文本分析,情感分析,社区讨论,数据挖掘 数据概述: 本数据集收录了来自Reddit社区r/FantasyPL的帖子和评论,该社区主要讨论英超梦幻联赛(Fantasy Premier League)。数据通过Python Reddit...
    packageimg
  • 神经信息处理系统大会论文提交数据集NeurIPS2016-2019

    2025年4月14日   

    神经信息处理系统大会论文提交数据集NeurIPS2016-2019 数据来源:互联网公开数据 标签:NeurIPS,机器学习,计算神经科学,论文,学术会议,文本分析,自然语言处理,主题建模,聚类,分类 数据概述:...
    packageimg
  • 孟加拉语维基百科语料库数据集

    2025年4月14日   

    孟加拉语维基百科语料库数据集 数据来源:互联网公开数据 标签:孟加拉语,维基百科,自然语言处理,NLP,文本分析,机器学习,语料库 数据概述:...
    packageimg
  • 多标签分类新闻类别数据集

    2025年4月14日   

    多标签分类新闻类别数据集 数据来源:互联网公开数据 标签:多标签分类,新闻类别,文本分析,机器学习,自然语言处理,信息提取,数据标注 数据概述:...
    packageimg
  • 洛杉矶推特新闻数据集

    2025年4月14日   

    洛杉矶推特新闻数据集 数据来源:互联网公开数据 标签:洛杉矶,推特,新闻,分类,自然语言处理,NLP,文本分析 数据概述:...
    packageimg
  • 印度尼西亚垃圾邮件检测电子邮件数据集1963-2021

    2025年4月14日   

    印度尼西亚垃圾邮件检测电子邮件数据集1963-2021 数据来源:互联网公开数据 标签:垃圾邮件,电子邮件,分类,文本分析,网络安全,数据清洗,特征提取 数据概述:...
    packageimg
  • 情景喜剧宋飞正传剧本对话数据集

    2025年4月14日   

    情景喜剧宋飞正传剧本对话数据集 数据来源:互联网公开数据 标签:宋飞正传,情景喜剧,剧本,对话,角色,文本分析,喜剧,电视剧 数据概述: 本数据集包含了美国经典情景喜剧《宋飞正传》(Seinfeld)的剧本对话内容,涵盖了该剧所有季的剧集。数据集的核心内容是剧中的角色对话,以及相关的剧集和季节信息。数据以结构化的形式呈现,方便用户进行分析和探索。...
    packageimg
  • 越南职位发布数据集越南语版

    2025年4月14日   

    越南职位发布数据集越南语版 数据来源:互联网公开数据 标签:越南,职位发布,求职,招聘,行业分析,数据挖掘,文本分析 数据概述:...
    packageimg
  • 美国鲨鱼坦克投资项目数据集

    2025年4月14日   

    美国鲨鱼坦克投资项目数据集 数据来源:互联网公开数据 标签:鲨鱼坦克,投资项目,创业,商业分析,投资决策,文本分析,创业支持 数据概述:...
    packageimg
  • 网络欺凌分类分析推文数据集

    2025年4月14日   

    网络欺凌分类分析推文数据集 数据来源:互联网公开数据 标签:网络欺凌,推文分类,社会媒体,文本分析,机器学习,数据挖掘,心理健康,社会行为 数据概述:...
    packageimg
  • 亚马逊商品用户评价数据集-多品类商品-时间跨度未知

    2025年4月14日   

    亚马逊商品用户评价数据集-多品类商品-时间跨度未知 数据来源:互联网公开数据 标签:亚马逊,用户评价,商品评论,消费者反馈,星级评分,评论文本,商品信息,文本分析,情感分析 数据概述:...
    packageimg