找到11,745个数据集

标签: 自然语言处理

过滤结果
  • 网络流行语词典数据集-2021年

    2025年6月1日   

    网络流行语词典数据集-2021年 数据来源:互联网公开数据 标签:流行语,网络语言,词典,文本分析,自然语言处理,数据挖掘,社会学研究 数据概述: 本数据集包含截至2021年6月1日Urban...
    packageimg
  • 法律文本知识库数据集

    2025年6月1日   

    法律文本知识库数据集 数据来源:互联网公开数据 标签:法律文本,知识库,自然语言处理,文本挖掘,法律信息,文本分析 数据概述:...
    packageimg
  • 多样饮食分类与标注烹饪食谱数据集-2023-nazmussakibrupol

    2025年6月1日   

    多样饮食分类与标注烹饪食谱数据集-2023-nazmussakibrupol 数据来源:互联网公开数据 标签:烹饪食谱,食品分类,自然语言处理,营养分析,食谱生成,机器学习,数据标注 数据概述: 本数据集收录了由“Assorted, Archetypal, and Annotated Two Million...
    packageimg
  • 说服力分析数据集-2-0版本-deepaksingh47

    2025年6月1日   

    说服力分析数据集-2-0版本-deepaksingh47 数据来源:互联网公开数据 标签:说服力,数据集,自然语言处理,NLP,教育,自动化评分,写作分析 数据概述: 本数据集包含两个主要部分:persuade_corpus_2.0 和 persuade_corpus_1.0。这两个数据集均来源于指定的公开数据源。此外,我们还新增了一个文件...
    packageimg
  • 联邦议会会议情绪分析数据集

    2025年6月1日   

    联邦议会会议情绪分析数据集 数据来源:互联网公开数据 标签:联邦议会,情绪分析,政治沟通,政党代表,时间序列,政治科学,自然语言处理 数据概述:...
    packageimg
  • 雅虎问答综合问答数据集-2000至2010年

    2025年6月1日   

    雅虎问答综合问答数据集-2000至2010年 数据来源:互联网公开数据 标签:雅虎问答,综合问答,数据集,机器学习,分类,文本分析,自然语言处理,大型数据集 数据概述:...
    packageimg
  • 亚马逊商品评论情感分析数据集-用户评价-大规模数据集

    2025年6月1日   

    亚马逊商品评论情感分析数据集-用户评价-大规模数据集 数据来源:互联网公开数据 标签:亚马逊,商品评论,情感分析,用户评价,文本分类,机器学习,自然语言处理,情感极性 数据概述:...
    packageimg
  • 维基百科推广文章数据集

    2025年6月1日   

    维基百科推广文章数据集 数据来源:互联网公开数据 标签:推广文章,维基百科,文本分类,内容分析,数据挖掘,信息质量,自然语言处理 数据概述: 本数据集包含两类文章:一类是被用户标记为“具有推广性语气”的文章(promotional.csv),另一类是被评估为“优质文章”的文章(good.csv)。 - 每篇推广性文章可能带有多个标签,包括但不限于: -...
    packageimg
  • Tashkeela清理阿拉伯语带音符语料库

    2025年6月1日   

    Tashkeela清理阿拉伯语带音符语料库 数据来源:互联网公开数据 标签:阿拉伯语,自然语言处理,文本清洗,语音标注,语言模型,机器学习,数据标注 数据概述:...
    packageimg
  • Coursera数据科学专项课程数据集-文本内容分析-英语语料库

    2025年6月1日   

    Coursera数据科学专项课程数据集-文本内容分析-英语语料库 数据来源:互联网公开数据 标签:自然语言处理,文本分析,机器学习,语料库,Coursera,博客,新闻,推特,英语,数据科学 数据概述: 本数据集是Coursera数据科学专项课程的Capstone项目所使用的数据集,其语料库来源于HC...
    packageimg
  • 人工智能与人类文本区分数据集

    2025年6月1日   

    人工智能与人类文本区分数据集 数据来源:互联网公开数据 标签:人工智能,文本分类,文本转换,自然语言处理,NLP,数据分类,文本生成,文本质量评估 数据概述:...
    packageimg
  • RSICD图像描述数据集

    2025年6月1日   

    RSICD图像描述数据集 数据来源:互联网公开数据 标签:图像描述,计算机视觉,自然语言处理,图像生成,图像检索,机器学习,数据集 数据概述:...
    packageimg
  • ELI5评分训练数据集

    2025年6月1日   

    ELI5评分训练数据集 数据来源:互联网公开数据 标签:问答系统,评分模型,ELI5,问答对,评分训练,自然语言处理,Transformer模型,机器学习 数据概述: 本数据集旨在为训练问答系统的评分模型提供数据支持。数据集包含问答对及其对应的评分,每个问答对以 Roberta 格式存储,并附带一个非负整数的评分值。数据集分为两类:一类是来自原始...
    packageimg
  • 开放海象增强数据集

    2025年6月1日   

    开放海象增强数据集 数据来源:互联网公开数据 标签:自动化评分,自然语言处理,深度学习,教育技术,GPT模型,数据增强,模型训练,机器学习评估,多语言模型,教育分析 数据概述:...
    packageimg
  • TensorFlow2-0问答数据集简化版-问答数据

    2025年6月1日   

    TensorFlow2-0问答数据集简化版-问答数据 数据来源:互联网公开数据 标签:TensorFlow,问答,自然语言处理,机器学习,数据集,文本分析,简化版 数据概述: 本数据集基于TensorFlow...
    packageimg
  • COVID-19实体识别数据集

    2025年6月1日   

    COVID-19实体识别数据集 数据来源:互联网公开数据 标签:COVID-19,实体识别,自然语言处理,公共卫生,文本挖掘,知识图谱,信息提取 数据概述:...
    packageimg
  • 土耳其医生患者问答数据集-2023-kaayra2000

    2025年6月1日   

    土耳其医生患者问答数据集-2023-kaayra2000 数据来源:互联网公开数据 标签:医生患者问答,医学,自然语言处理,教育,土耳其,数据分析,健康沟通 数据概述:...
    packageimg
  • Reddit恋爱关系社区帖子内容数据集

    2025年6月1日   

    Reddit恋爱关系社区帖子内容数据集 数据来源:互联网公开数据 标签:Reddit,恋爱关系,文本生成,社区数据,自然语言处理,社交媒体分析 数据概述: 本数据集源自Reddit网站,包含“relationships”(恋爱关系)社区中帖子的ID和内容,仅保留长度超过50个字符的帖子。该数据集旨在用于文本生成模型的微调训练。 数据用途概述:...
    packageimg
  • 亚马逊电子产品用户评价情感分析数据集-2018年

    2025年6月1日   

    亚马逊电子产品用户评价情感分析数据集-2018年 数据来源:互联网公开数据 标签:亚马逊,电子产品,用户评价,情感分析,文本挖掘,评分,评论,NLP,自然语言处理 数据概述:...
    packageimg
  • 英印电影字幕数据集

    2025年6月1日   

    英印电影字幕数据集 数据来源:互联网公开数据 标签:电影字幕,印尼语翻译,英文原字幕,翻译研究,语言学习,自然语言处理,跨语言分析 数据概述: 本数据集来源于公开字幕资源,包含英文原字幕及其对应的印尼语翻译。数据集中的每条记录包含两个关键字段:英文原字幕和印尼语翻译。这些数据为研究跨语言翻译、语言对比以及机器翻译提供了丰富的语料支持。 数据用途概述:...
    packageimg