找到11,761个数据集

标签: 自然语言处理

过滤结果
  • 泰国美容产品评论数据集

    2025年4月19日   

    泰国美容产品评论数据集 数据来源:互联网公开数据 标签:泰国美容产品评论,情感分析,自然语言处理,消费者评价,星评体系,文本分析 数据概述: 本数据集来自泰国最大的美容产品评论网站,旨在为情感分析项目提供数据支持。数据集包含用户对美容产品的评分及评论,其中评分采用5星制,评论内容为用户对产品的多样化评价。 数据用途概述:...
    packageimg
  • 微博失业话题讨论数据集

    2025年4月19日   

    微博失业话题讨论数据集 数据来源:互联网公开数据 标签:失业,社交媒体,文本分析,社会热点,舆论趋势,自然语言处理,就业市场 数据概述:...
    packageimg
  • 加密货币社交媒体讨论数据分析集2022-2023

    2025年4月19日   

    加密货币社交媒体讨论数据分析集2022-2023 数据来源:互联网公开数据 标签:加密货币,社交媒体,公众意见,市场趋势,自然语言处理,情感分析 数据概述:...
    packageimg
  • 多语言情感分析数据集

    2025年4月19日   

    多语言情感分析数据集 数据来源:互联网公开数据 标签:情感分析,自然语言处理,多语言模型,文本分类,LLM生成,数据清洗 数据概述:...
    packageimg
  • Twitter情感数据集

    2025年4月19日   

    Twitter情感数据集 数据来源:互联网公开数据 标签:社交媒体,情感分析,情绪分类,文本数据,自然语言处理,情感识别,机器学习 数据概述:...
    packageimg
  • 推特社交媒体海量推文情感分析数据集-两年期

    2025年4月19日   

    推特社交媒体海量推文情感分析数据集-两年期 数据来源:互联网公开数据 标签:推特,社交媒体,情感分析,自然语言处理,文本分析,用户生成内容,机器学习,文本分类,时间序列分析,用户行为 数据概述:...
    packageimg
  • 印尼新闻标题数据集

    2025年4月19日   

    印尼新闻标题数据集 数据来源:互联网公开数据 标签:印尼,新闻标题,clickbait,自然语言处理,文本分类,新闻媒体,数据标注 数据概述: 本数据集由 CLICK-ID 数据集组成,主要包含来自 12 家印尼本地新闻网站(如 detikNews、Fimela、Kapanlagi 等)的新闻标题数据。数据集分为两部分:(1) 46,119...
    packageimg
  • AES2024辅助数据集

    2025年4月19日   

    AES2024辅助数据集 数据来源:互联网公开数据 标签:自然语言处理,机器学习,自动评分,写作评估,特征重要性,模型对象,向量化器 数据概述: 本数据集是为“Learning Agency Lab - Automated Essay Scoring...
    packageimg
  • 来自可兰经的阿拉伯语手写数据集AHDQ

    2025年4月19日   

    来自可兰经的阿拉伯语手写数据集AHDQ 数据来源:互联网公开数据 标签:阿拉伯语手写,可兰经,OCR,文化传承,机器学习,计算机视觉,自然语言处理 数据概述:...
    packageimg
  • 阿尔及利亚网阿拉伯语新闻文章数据集1963-2021

    2025年4月19日   

    阿尔及利亚网阿拉伯语新闻文章数据集1963-2021 数据来源:互联网公开数据 标签:阿拉伯语新闻,自然语言处理,机器学习,语料库,情感分析,主题分类,命名实体识别 数据概述:...
    packageimg
  • 新闻真伪鉴别-印度新闻文章数据集2023-2024

    2025年4月19日   

    新闻真伪鉴别-印度新闻文章数据集2023-2024 数据来源:互联网公开数据 标签:假新闻,真新闻,新闻分析,文本分类,自然语言处理,印度,新闻报道,数据挖掘,信息可靠性 数据概述: 本数据集旨在用于新闻真伪鉴别研究,收录了来自印度不同新闻来源的文章。 数据集包含两类文章:一类来自如《印度时报》(Times of...
    packageimg
  • 北欧语言识别数据集

    2025年4月19日   

    北欧语言识别数据集 数据来源:互联网公开数据 标签:语言识别,北欧语言,自然语言处理,机器学习,数据分类,丹麦语,瑞典语,挪威语,法罗语,冰岛语 数据概述:...
    packageimg
  • Quora问答平台问题重复识别数据集

    2025年4月19日   

    Quora问答平台问题重复识别数据集 数据来源:互联网公开数据 标签:问答平台,自然语言处理,机器学习,文本相似度,重复问题,Quora,语义分析 数据概述:...
    packageimg
  • Flickr8k图像日语翻译数据集

    2025年4月19日   

    Flickr8k图像日语翻译数据集 数据来源:互联网公开数据 标签:图像标注,日语翻译,机器翻译,图像识别,自然语言处理,图像描述,Flickr8k,多模态,文本数据 数据概述:...
    packageimg
  • 电影评论情感预测数据集

    2025年4月19日   

    电影评论情感预测数据集 数据来源:互联网公开数据 标签:电影评论,情感分析,文本分类,机器学习,自然语言处理,NLP,数据分析,电影元数据 数据概述:...
    packageimg
  • 新闻情感分析数据集2008-2024

    2025年4月19日   

    新闻情感分析数据集2008-2024 数据来源:互联网公开数据 标签:新闻,情感分析,股票市场预测,自然语言处理,NLTK VADER,NLTK RoBERTa,Hugging Face DistilBERT,时间序列,金融分析,文本挖掘 数据概述: 本数据集涵盖2008年6月8日至2024年8月3日期间来自三大新闻来源的新闻文章,包括Reddit...
    packageimg
  • 土耳其图书数据集

    2025年4月19日   

    土耳其图书数据集 数据来源:互联网公开数据 标签:土耳其文学,书籍信息,数据挖掘,分类分析,推荐系统,自然语言处理,NLP 数据概述:...
    packageimg
  • GlaivePython代码质量保证问答数据集

    2025年4月19日   

    GlaivePython代码质量保证问答数据集 数据来源:互联网公开数据 标签:Python, 代码质量, 问答, 自然语言处理, 机器学习, 代码助手, 代码生成, 编程学习, 开发工具 数据概述: 本数据集由Hugging Face Hub...
    packageimg
  • Jigsaw多语言有毒评论分类预处理数据集

    2025年4月19日   

    Jigsaw多语言有毒评论分类预处理数据集 数据来源:互联网公开数据 标签:自然语言处理,文本分类,有毒评论,多语言,预处理,机器学习,XLM-RoBERTa,Jigsaw 数据概述: 本数据集包含Jigsaw多语言有毒评论分类任务的预处理后的CSV文件。数据使用Hugging Face...
    packageimg
  • 自然语言处理数据集-缩略语与表情符号

    2025年4月18日   

    自然语言处理数据集-缩略语与表情符号 数据来源:互联网公开数据 标签:自然语言处理,文本预处理,缩略语,标点符号,表情符号,情感分析,数据清洗,文本挖掘,NLP 数据概述: 本数据集为自然语言处理(NLP)和文本挖掘任务提供了丰富的资源支持,包含多个关键文件,用于文本预处理过程中的数据清洗和特征提取。数据集主要组成部分包括:...
    packageimg