找到11,799个数据集

标签: 自然语言处理

过滤结果
  • 中文文本分类标签数据集-训练集-独有标签及原始标签数据-hengwdai

    2025年4月24日   

    中文文本分类标签数据集-训练集-独有标签及原始标签数据-hengwdai 数据来源:互联网公开数据 标签:文本分类,自然语言处理,中文,标签,训练集,RoBERTa,机器学习 数据概述: 本数据集包含三个子集,均与中文文本分类任务相关,主要基于RoBERTa模型进行标签生成与处理。 AM-1 (使用180_filtered_rb标记的训练集):...
    packageimg
  • 印度公共评论情感分析数据集JantaNLPDataset-vijuc895

    2025年4月24日   

    印度公共评论情感分析数据集JantaNLPDataset-vijuc895 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,机器学习,文本挖掘,社交媒体,印度语言,多语言处理 数据概述: 该数据集来自Janta NLP项目,主要包含印度公共平台的评论数据,用于情感分析任务。主要特征如下:...
    packageimg
  • 韩国文本到SQL生成数据集Ko-Text2SQLDataset-cocolabhub

    2025年4月24日   

    韩国文本到SQL生成数据集Ko-Text2SQLDataset-cocolabhub 数据来源:互联网公开数据 标签:自然语言处理,文本到SQL,数据集,语义解析,机器学习,数据库,人工智能,韩国语 数据概述: 该数据集由韩国文本到SQL生成任务的数据组成,旨在促进韩国语环境下文本到SQL技术的研发。主要特征如下:...
    packageimg
  • BERT模型基线实验数据集BERTBaselineExperimentDataset-kenkrige

    2025年4月24日   

    BERT模型基线实验数据集BERTBaselineExperimentDataset-kenkrige 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,情感分析,机器翻译,文本生成,深度学习,BERT模型 数据概述: 该数据集包含了用于训练和评估BERT模型的基础文本数据,用于构建BERT模型的基线实验。主要特征如下:...
    packageimg
  • 亚马逊图书评论数据集AmazonBookReviewDataset-manishthilagar

    2025年4月24日   

    亚马逊图书评论数据集AmazonBookReviewDataset-manishthilagar 数据来源:互联网公开数据 标签:图书评论,数据集,自然语言处理,情感分析,机器学习,电商分析,消费者行为,数据挖掘 数据概述: 该数据集包含来自亚马逊的图书评论数据,记录了用户对图书的评价和评分等信息。主要特征如下:...
    packageimg
  • 印度新冠疫情新闻数据集IndianNewsDataCorona-nikhilmishra21

    2025年4月24日   

    印度新冠疫情新闻数据集IndianNewsDataCorona-nikhilmishra21 数据来源:互联网公开数据 标签:新冠疫情,印度,新闻数据,自然语言处理,文本分析,疫情分析,新闻媒体,公共卫生 数据概述: 该数据集包含来自印度新闻媒体关于新冠疫情的报道数据,记录了疫情期间的新闻文章内容。主要特征如下:...
    packageimg
  • 社交媒体用户个性化推荐数据集SLP用户推荐数据集-ktgiahieu

    2025年4月24日   

    社交媒体用户个性化推荐数据集SLP用户推荐数据集-ktgiahieu 数据来源:互联网公开数据 标签:社交媒体,用户行为,个性化推荐,机器学习,自然语言处理,数据集,用户画像,推荐系统 数据概述:该数据集包含来自社交媒体平台的用户行为数据,旨在用于个性化推荐系统的研究和开发。主要特征如下: 时间跨度:数据记录的时间范围为平台用户交互的完整历史记录。...
    packageimg
  • Kaggle技能评估挑战数据集KaggleSkillAssessmentChallengeDataset-viveksomvanshi

    2025年4月24日   

    Kaggle技能评估挑战数据集KaggleSkillAssessmentChallengeDataset-viveksomvanshi 数据来源:互联网公开数据 标签:技能评估,数据集,自然语言处理,文本分析,机器学习,人才评估,职业发展,知识图谱...
    packageimg
  • 社交媒体领导推文数据集LeaderTweetsDataset-mariasandalwala

    2025年4月24日   

    社交媒体领导推文数据集LeaderTweetsDataset-mariasandalwala 数据来源:互联网公开数据 标签:社交媒体,领导推文,数据集,文本分析,自然语言处理,社会学研究,政治分析,公众意见 数据概述:该数据集包含来自不同社交媒体平台的领导推文,记录了全球各地领导人在社交媒体上的发言内容。主要特征如下:...
    packageimg
  • 新冠疫情快速响应聊天机器人数据集COVID-19RapidResponseAgentChatbotDataset-nelakurthisudheer

    2025年4月24日   

    新冠疫情快速响应聊天机器人数据集COVID-19RapidResponseAgentChatbotDataset-nelakurthisudheer 数据来源:互联网公开数据 标签:新冠疫情,聊天机器人,数据集,自然语言处理,问答系统,医疗健康,人工智能,疫情应对 数据概述:...
    packageimg
  • NetflixTwitter帖子情感分析与语言模型训练数据集2024年-tomthescientist

    2025年4月24日   

    NetflixTwitter帖子情感分析与语言模型训练数据集2024年-tomthescientist 数据来源:互联网公开数据 标签:Netflix,推特,情感分析,自然语言处理,公众意见,趋势研究,LLM,数据集 数据概述:...
    packageimg
  • 罗马乌尔都语情感分析数据集RomanUrduSentimentAnalysisDataset-saimalam

    2025年4月24日   

    罗马乌尔都语情感分析数据集RomanUrduSentimentAnalysisDataset-saimalam 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,文本分析,机器学习,乌尔都语,社交媒体,学术研究 数据概述:该数据集包含来自社交媒体平台的罗马乌尔都语文本数据,记录了用户的评论和意见,适用于情感分析任务。主要特征如下:...
    packageimg
  • 世界新闻页面数据分析集TRTHaberWorldforNewsPagesData-denizhanahin

    2025年4月24日   

    世界新闻页面数据分析集TRTHaberWorldforNewsPagesData-denizhanahin 数据来源:互联网公开数据 标签:新闻页面,数据集,文本分析,自然语言处理,全球新闻,媒体研究,信息提取,社会学研究 数据概述:该数据集包含来自土耳其广播电视台TRT Haber的全球新闻页面数据,记录了世界范围内的新闻报道内容。主要特征如下:...
    packageimg
  • 科研文章主题建模分析数据集-独立日机器学习黑客松2020-aswathrao

    2025年4月24日   

    科研文章主题建模分析数据集-独立日机器学习黑客松2020-aswathrao 数据来源:互联网公开数据 标签:机器学习,自然语言处理,主题建模,科研文章,文本分析,计算机科学,物理学,数学,统计学,生物学,金融学 数据概述:...
    packageimg
  • 大语言模型提示恢复提示数据集LLMPromptRecoveryDataset-nedomer

    2025年4月24日   

    大语言模型提示恢复提示数据集LLMPromptRecoveryDataset-nedomer 数据来源:互联网公开数据 标签:大语言模型,提示恢复,数据集,自然语言处理,机器学习,人工智能,文本生成,对话系统 数据概述:该数据集包含用于大语言模型提示恢复的文本数据,记录了原始提示和相应的恢复提示。主要特征如下:...
    packageimg
  • 知识库构建与应用数据集KnowledgeBaseDataset-mariamelseedawy

    2025年4月24日   

    知识库构建与应用数据集KnowledgeBaseDataset-mariamelseedawy 数据来源:互联网公开数据 标签:知识库,数据集,信息检索,自然语言处理,人工智能,机器学习,语义网,知识图谱 数据概述: 该数据集包含用于知识库构建与应用的多领域结构化数据,记录了各类实体,属性及关系信息。主要特征如下: 时间跨度:...
    packageimg
  • 西班牙国会发言标点检测数据集

    2025年4月24日   

    西班牙国会发言标点检测数据集 数据来源:互联网公开数据 标签:西班牙国会,标点符号检测,自然语言处理,文本分析,语料库,语法结构,语言模型,文本分类 数据概述: 本数据集收录了2011年至2020年间西班牙国会议员的完整发言记录,按发言人分段整理。每句话被拆分为单个单词,并根据以下标准进行分类: 1....
    packageimg
  • 文本处理测试数据集-sandeep100joshi

    2025年4月24日   

    文本处理测试数据集-sandeep100joshi 数据来源:互联网公开数据 标签:文本处理,测试,数据集,自然语言处理,机器学习,文本分析,数据清洗,模型评估 数据概述: 该数据集包含用于文本处理任务的测试数据,记录了各种文本信息。主要特征如下: 时间跨度: 数据记录的时间范围不限,主要关注文本内容本身。 地理范围:...
    packageimg
  • 产品关键词生成数据集-sarafrancic

    2025年4月24日   

    产品关键词生成数据集-sarafrancic 数据来源:互联网公开数据 标签:产品,关键词,生成,文本分析,自然语言处理,机器学习,搜索引擎优化,市场营销 数据概述:该数据集包含从各种来源收集的产品描述和相应的关键词,用于训练和评估关键词生成模型。主要特征如下: 时间跨度:数据收集时间跨度不限,持续更新。 地理范围:数据来源广泛,涵盖全球市场。...
    packageimg
  • 情绪文本数据集EmotionsCleanTextDataset-markta186

    2025年4月24日   

    情绪文本数据集EmotionsCleanTextDataset-markta186 数据来源:互联网公开数据 标签:情绪分析,文本数据,数据集,自然语言处理,情感识别,机器学习,心理学,社会研究 数据概述: 该数据集包含经过清洗和标注的情绪文本数据,记录了不同情绪状态下的文本描述。主要特征如下:...
    packageimg