找到11,752个数据集

标签: 自然语言处理

过滤结果
  • 疾病文章数据集

    2025年4月15日   

    疾病文章数据集 数据来源:互联网公开数据 标签:疾病,文章,文本处理,自然语言处理,Spacy,BERT,机器学习 数据概述:...
    packageimg
  • 土耳其语文本分类预处理数据集

    2025年4月15日   

    土耳其语文本分类预处理数据集 数据来源:互联网公开数据 标签:文本分类,土耳其语,预处理,机器学习,自然语言处理,文本挖掘 数据概述:...
    packageimg
  • 印尼形容词情感数据集

    2025年4月15日   

    印尼形容词情感数据集 数据来源:互联网公开数据 标签:印尼语,形容词,情感分析,自然语言处理,文本挖掘,词典数据 数据概述: 本数据集包含从《大印尼语词典》(KBBI)中提取的形容词及其情感标签。数据集分为两个文件:indonesian-adjective-sentiment-raw.csv 和 indonesian-adjective-...
    packageimg
  • 社交媒体Twitter巴西葡萄牙语情感分析数据集

    2025年4月15日   

    社交媒体Twitter巴西葡萄牙语情感分析数据集 数据来源:互联网公开数据 标签:情感分析,葡萄牙语,巴西,社交媒体文本,自然语言处理,文本分类,情绪识别 数据概述 本数据集为 Caramelo-Smile-V3 模型的情感分析训练数据,完全基于巴西葡萄牙语(PT-BR)。数据集构建自 Twitter...
    packageimg
  • 进击的巨人IMDb用户评论情感分析数据集

    2025年4月15日   

    进击的巨人IMDb用户评论情感分析数据集 数据来源:互联网公开数据 标签:进击的巨人,IMDb,动漫,用户评论,情感分析,自然语言处理,文本挖掘,评论数据 数据概述: 本数据集包含2098条关于动漫《进击的巨人》(Shingeki no...
    packageimg
  • 文档嵌入技术研究数据集

    2025年4月15日   

    文档嵌入技术研究数据集 数据来源:互联网公开数据 标签:文档嵌入,自然语言处理,机器学习,数据可视化,文本分析,技术研究,zstandard压缩 数据概述:...
    packageimg
  • CounselChat心理咨询对话数据集

    2025年4月15日   

    CounselChat心理咨询对话数据集 数据来源:互联网公开数据 标签:心理咨询,对话,NLP,自然语言处理,情感分析,文本数据,CounselChat,语料库 数据概述: 本数据集收录了从 CounselChat 网站抓取的心理咨询对话数据。 CounselChat...
    packageimg
  • 印度及全球虚假与真实职位列表数据集1963-2021

    2025年4月15日   

    印度及全球虚假与真实职位列表数据集1963-2021 数据来源:互联网公开数据 标签:职位列表,印度,全球,虚假职位,真实职位,就业市场,自然语言处理 数据概述:...
    packageimg
  • 英国脱欧媒体舆论新闻文本数据集2016-2023

    2025年4月15日   

    英国脱欧媒体舆论新闻文本数据集2016-2023 数据来源:互联网公开数据 标签:英国脱欧,媒体舆论,文本分析,自然语言处理,新闻文本,舆论演变,主题建模 数据概述:...
    packageimg
  • 洋葱网讽刺新闻媒体内容数据集当前

    2025年4月15日   

    洋葱网讽刺新闻媒体内容数据集当前 数据来源:互联网公开数据 标签:讽刺新闻,洋葱网,媒体内容,自然语言处理,文本分类,数据分析 数据概述: 本数据集收录了洋葱网(The Onion)发布的讽刺新闻内容,包括新闻标题、发布时间及详细内容。数据集涵盖当前时间段内的新闻内容,展示了洋葱网独特的讽刺风格和媒体内容创作特点。 数据用途概述:...
    packageimg
  • 缅甸农业知识库数据集

    2025年4月15日   

    缅甸农业知识库数据集 数据来源:互联网公开数据 标签:缅甸农业,自然语言处理,指令调优语言模型,低资源语言,农作物,园艺,化学农药,植物病理学,气候变化,有机肥料 数据概述:...
    packageimg
  • 数据2023年电影产业数据分析数据集

    2025年4月15日   

    数据2023年电影产业数据分析数据集 数据来源:互联网公开数据 标签:电影数据,电影产业,票房分析,预算预测,导演分析,演员分析,推荐系统,自然语言处理 数据概述: 本数据集收录了超过5000部电影的信息,包括预算、票房收入、演员阵容、导演、制作公司及电影类型等多方面特征。数据集涵盖了从热门到相对小众的电影,提供了电影产业的全面概述。数据收集自The...
    packageimg
  • 情感分析抑郁情绪识别数据集

    2025年4月15日   

    情感分析抑郁情绪识别数据集 数据来源:互联网公开数据 标签:情感分析,抑郁,情绪识别,文本数据,机器学习,自然语言处理,情感标签 数据概述: 本数据集包含文本数据,其中“text_id”列用于存储情感文本,而“is_depression”列则作为标签,用于指示该情感是否被归类为抑郁情绪。如果情感被判定为抑郁,则标签值为1;否则,标签值为0。...
    packageimg
  • Reddit宗教文本分类数据集

    2025年4月15日   

    Reddit宗教文本分类数据集 数据来源:互联网公开数据 标签:Reddit, 宗教, 文本分类, 自然语言处理, 社交媒体, 文本数据, 宗教信仰 数据概述:...
    packageimg
  • 顶级15款手机应用用户反馈数据集

    2025年4月15日   

    顶级15款手机应用用户反馈数据集 数据来源:互联网公开数据 标签:用户反馈,手机应用,自然语言处理,文本分类,主题建模,用户情感,用户偏好,趋势分析 数据概述:...
    packageimg
  • 韩国语词汇频率数据集

    2025年4月15日   

    韩国语词汇频率数据集 数据来源:互联网公开数据 标签:词汇频率,韩国语,自然语言处理,NLP,词频统计,语言学,语料库,词根分析,借词研究 数据概述 本数据集由韩国国立国语研究院(National Institute of the Korean...
    packageimg
  • 英语-法语翻译数据集

    2025年4月15日   

    英语-法语翻译数据集 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,英语,法语,文本数据,语言对,翻译模型 数据概述: 本数据集包含138,000对英语-法语翻译的句子对。每对数据由一个英语句子及其对应的法语翻译构成。数据集提供了丰富的翻译实例,涵盖了多种主题和语言风格。 数据用途概述:...
    packageimg
  • 推特用户MBTI人格类型数据集

    2025年4月15日   

    推特用户MBTI人格类型数据集 数据来源:互联网公开数据 标签:推特用户,MBTI人格类型,文本分析,自然语言处理,机器学习,社交网络分析,行为特征,语言特征,网络特征 数据概述: 本数据集包含了8,328名推特用户的详细信息,这些用户在其个人资料中公开了他们的MBTI人格类型。数据集记录了每名用户的身份特征、行为特征、语言特征和网络特征。 -...
    packageimg
  • 七十士译本数据集

    2025年4月15日   

    七十士译本数据集 数据来源:互联网公开数据 标签:七十士译本,旧约圣经,希伯来文,希腊文,圣经翻译,NLP,自然语言处理,文本分析 数据概述:...
    packageimg
  • 印尼新闻网站DetikNews每日头条数据集-2015年1月至2020年10月

    2025年4月15日   

    印尼新闻网站DetikNews每日头条数据集-2015年1月至2020年10月 数据来源:互联网公开数据 标签:印尼新闻,头条,DetikNews,新闻分析,自然语言处理,媒体研究,时间序列,印尼语 数据概述:...
    packageimg