找到587个数据集

标签: NLP

过滤结果
  • IMDbTop250电视剧用户评论与评分数据集-2024

    2025年4月16日   

    IMDbTop250电视剧用户评论与评分数据集-2024 数据来源:互联网公开数据 标签:IMDb, 电视剧, 评论, 评分, 用户评价, NLP, 自然语言处理, 情感分析, 文本挖掘 数据概述: 本数据集收录了截至2024年IMDb Top...
    packageimg
  • 斯瓦希里语新闻分类数据集

    2025年4月16日   

    斯瓦希里语新闻分类数据集 数据来源:互联网公开数据 标签:斯瓦希里语,新闻分类,自然语言处理,NLP,非洲语言,语言保护,文本分析,多语言数据 数据概述:...
    packageimg
  • Twitter社交媒体情感分析数据集

    2025年4月16日   

    Twitter社交媒体情感分析数据集 数据来源:互联网公开数据 标签:Twitter,社交媒体,情感分析,NLP,自然语言处理,文本数据,情绪识别,舆情分析 数据概述:...
    packageimg
  • 亚马逊服饰推荐系统数据集

    2025年4月16日   

    亚马逊服饰推荐系统数据集 数据来源:互联网公开数据 标签:服饰推荐,亚马逊,NLP,深度学习,图像识别,产品推荐,电子商务 数据概述: 本数据集包含了亚马逊平台上服饰产品的详细信息,包括产品描述、用户行为数据、历史推荐记录以及相关文本和图像数据。数据集旨在为研究和开发服饰推荐系统提供基础支持,帮助优化推荐算法,提升用户购物体验。 数据用途概述:...
    packageimg
  • IWSLT2017英语-中文翻译数据集

    2025年4月15日   

    IWSLT2017英语-中文翻译数据集 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,NLP,多语种,英中翻译,语言模型训练,语料库 数据概述 本数据集是IWSLT2017翻译任务的英语-中文平行语料数据集,主要用于机器翻译研究和多语言自然语言处理任务。数据集包含三个独立的CSV文件,分别存储训练集、验证集和测试集。数据来源于Hugging...
    packageimg
  • 基于GPT-2生成的灾难推文数据集

    2025年4月15日   

    基于GPT-2生成的灾难推文数据集 数据来源:互联网公开数据 标签:NLP,自然语言处理,灾难推文,数据增强,GPT-2,文本生成 数据概述:...
    packageimg
  • 网络安全BERT模型训练数据集-网络安全文本数据-多源文本-通用

    2025年4月15日   

    网络安全BERT模型训练数据集-网络安全文本数据-多源文本-通用 数据来源:互联网公开数据 标签:网络安全,BERT,NLP,威胁检测,文本分类,恶意软件分析,漏洞,网络安全威胁,文本数据,机器学习 数据概述: Cyber-...
    packageimg
  • 印度象棋策略书籍文本与游戏数据集1963-2021

    2025年4月15日   

    印度象棋策略书籍文本与游戏数据集1963-2021 数据来源:互联网公开数据 标签:国际象棋,策略书籍,NLP,文本分析,游戏分析,主题建模,文档聚类,文本生成 数据概述: 本数据集收录了国际象棋大师Edward...
    packageimg
  • 开放域问答数据集-问题与答案-2023年

    2025年4月15日   

    开放域问答数据集-问题与答案-2023年 数据来源:互联网公开数据 标签:问答,自然语言处理,NLP,文本数据,QA,问题解答,知识库,语言模型,机器学习 数据概述: 本数据集包含大量的问题与答案对,旨在为开放域问答(QA, Question...
    packageimg
  • 动漫数据集适用于NLP项目

    2025年4月15日   

    动漫数据集适用于NLP项目 数据来源:互联网公开数据 标签:动漫,推荐系统,NLP,文本分析,数据挖掘,自然语言处理,娱乐分析 数据概述: 本数据集主要用于构建著名的动漫推荐系统——Anime Odyssey。数据集涵盖了丰富的动漫信息,包括但不限于动漫名称、简介、类型、评分、评论等内容,为自然语言处理和文本分析提供了宝贵的数据资源。 数据用途概述:...
    packageimg
  • Kaggle文本数据竞赛优胜方案分析数据集-2021-2023

    2025年4月15日   

    Kaggle文本数据竞赛优胜方案分析数据集-2021-2023 数据来源:互联网公开数据 标签:Kaggle,文本数据,竞赛,机器学习,自然语言处理,NLP,解决方案,深度学习,模型,算法,优化器,集成,数据分析 数据概述: 本数据集收录了2021年至2023年间9个Kaggle文本数据竞赛中,每个竞赛前三名优胜方案的详细分析。...
    packageimg
  • 马鲁蒂铃木员工评价数据集1963-2021

    2025年4月15日   

    马鲁蒂铃木员工评价数据集1963-2021 数据来源:互联网公开数据 标签:马鲁蒂铃木,员工评价,工作环境,公司文化,职业发展,工作生活平衡,数据分析,情感分析,NLP,人力资源 数据概述: 本数据集汇集了马鲁蒂铃木(印度一家跨国汽车制造公司)员工在Ambition Box平台上分享的宝贵见解。Ambition...
    packageimg
  • NIL数据集-识别关注宣言的数据集1963-2021

    2025年4月15日   

    NIL数据集-识别关注宣言的数据集1963-2021 数据来源:互联网公开数据 标签:宣言识别,NLP,文本分析,事件研究,情绪分析,社会运动 数据概述:...
    packageimg
  • 奈飞电影详细信息与分析数据集-2023

    2025年4月15日   

    奈飞电影详细信息与分析数据集-2023 数据来源:互联网公开数据 标签:奈飞,电影数据,电影类型,上映时间,评分,时长,NLP,数据分析,教育 数据概述: 本数据集收录了奈飞平台上的电影详细信息,包含7个关键字段。数据集涵盖了电影的唯一标识符、类型、标题、添加日期、上映年份、评分和时长,为进行自然语言处理(NLP)任务和数据分析提供了丰富的信息基础。...
    packageimg
  • 土耳其语诗歌文本生成数据集

    2025年4月15日   

    土耳其语诗歌文本生成数据集 数据来源:互联网公开数据 标签:土耳其语,诗歌,文本生成,自然语言处理,NLP,诗歌创作,语言模型,文学 数据概述: 本数据集包含了7本土耳其语诗歌书籍,数据将每本书的诗歌内容拼接成一个单独的文本列。这些诗歌涵盖了不同的主题和风格,反映了土耳其文学的多样性。 数据用途概述:...
    packageimg
  • 超义关系数据集

    2025年4月15日   

    超义关系数据集 数据来源:互联网公开数据 标签:超义关系,自然语言处理,NLP,词汇语义,知识库,机器学习,神经网络,WordNet,DBPedia,Wikidata,Yago 数据概述:...
    packageimg
  • 查询意图领域分类数据集

    2025年4月15日   

    查询意图领域分类数据集 数据来源:互联网公开数据 标签:文本分类,自然语言处理,查询意图,领域分类,搜索引擎,NLP,机器学习 数据概述:...
    packageimg
  • COVID-19疫苗公众反应推特数据集

    2025年4月15日   

    COVID-19疫苗公众反应推特数据集 数据来源:互联网公开数据 数据集说明: 本数据集收集了与 Covishield 新冠疫苗 相关的推文文本,旨在支持自然语言处理(NLP)任务,如情感分析、主题提取、公众反应趋势研究等。Covishield 是由阿斯利康与牛津大学合作研发,并由印度血清研究所(Serum Institute of...
    packageimg
  • NLP数据增强工具库离线数据集1-0版数据集

    2025年4月15日   

    NLP数据增强工具库离线数据集1-0版数据集 数据来源:互联网公开数据 标签:NLP,文本增强,数据扩充,机器学习,自然语言处理,文本生成,数据集 数据概述:...
    packageimg
  • 电影数据分析与自然语言处理实践数据集-TMDB电影数据-时间不限

    2025年4月15日   

    电影数据分析与自然语言处理实践数据集-TMDB电影数据-时间不限 数据来源:互联网公开数据 标签:电影,TMDB,电影数据,NLP,自然语言处理,文本分析,情感分析,数据预处理,文本清洗,机器学习 数据概述: 本数据集包含了TMDB(The Movie...
    packageimg