找到11,784个数据集

标签: 自然语言处理

过滤结果
  • anno-data标注数据集Anno-DataLabelingDataset-naumangujjar26

    2025年4月22日   

    anno-data标注数据集Anno-DataLabelingDataset-naumangujjar26 数据来源:互联网公开数据 标签:标注数据,数据集,机器学习,数据挖掘,人工智能,自然语言处理,图像识别,计算机视觉 数据概述: 该数据集包含来自anno-data平台的标注数据,记录了各类数据样本的标注信息。主要特征如下:...
    packageimg
  • CommonLit英语文章摘要数据集-artisusxiren

    2025年4月22日   

    CommonLit英语文章摘要数据集-artisusxiren 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,英语学习,机器翻译,文本分析,语言模型,教育 数据概述: 该数据集包含来自CommonLit平台提供的英语文章摘要数据,旨在用于文本摘要,自然语言处理和英语学习相关的研究。主要特征如下:...
    packageimg
  • 家得宝商品搜索关键词数据集HomeDepotSearchKeywordsDataset-riteshpatil8998

    2025年4月22日   

    家得宝商品搜索关键词数据集HomeDepotSearchKeywordsDataset-riteshpatil8998 数据来源:互联网公开数据 标签:零售业,搜索关键词,数据集,自然语言处理,文本挖掘,机器学习,消费者行为,市场分析 数据概述: 该数据集包含来自家得宝(Home...
    packageimg
  • 巴基斯坦推特推文数据集PakistanTweetsDataset-umarfarooq45

    2025年4月22日   

    巴基斯坦推特推文数据集PakistanTweetsDataset-umarfarooq45 数据来源:互联网公开数据 标签:社交媒体,推特,文本分析,巴基斯坦,自然语言处理,情感分析,社会学,舆情分析 数据概述: 该数据集包含了来自巴基斯坦地区的推特推文数据,记录了用户在推特平台上的公开言论。主要特征如下:...
    packageimg
  • 检索公共测试数据集-nhutchung

    2025年4月22日   

    检索公共测试数据集-nhutchung 数据来源:互联网公开数据 标签:信息检索,数据集,文本分析,机器学习,自然语言处理,搜索,评估,测试 数据概述: 该数据集包含用于信息检索任务的公开测试数据,记录了检索系统性能的评估指标。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于具体数据集的发布时间。...
    packageimg
  • HackerNews网站文章数据集HackerNewsArticlesDataset-farapopoola

    2025年4月22日   

    HackerNews网站文章数据集HackerNewsArticlesDataset-farapopoola 数据来源:互联网公开数据 标签:Hacker News,新闻,社交媒体,数据分析,自然语言处理,文本挖掘,机器学习,网络社区 数据概述: 该数据集包含来自Hacker News网站的文章数据,记录了Hacker...
    packageimg
  • 自然语言处理与灾难推文数据集NLPwithDisasterTweetsCleanedData-phchen5

    2025年4月22日   

    自然语言处理与灾难推文数据集NLPwithDisasterTweetsCleanedData-phchen5 数据来源:互联网公开数据 标签:自然语言处理,灾难推文,数据集,文本分类,情感分析,机器学习,社交媒体,应急管理 数据概述: 该数据集包含了来自推特(Twitter)的推文数据,这些推文与各种灾难事件相关。主要特征如下:...
    packageimg
  • 命名实体识别原始数据集NamedEntityRecognitionRawDataDataset-kiruthigaa

    2025年4月22日   

    命名实体识别原始数据集NamedEntityRecognitionRawDataDataset-kiruthigaa 数据来源:互联网公开数据 标签:命名实体识别,数据集,自然语言处理,文本分析,机器学习,人工智能,语言学,文本挖掘 数据概述:该数据集包含来自多个来源的原始文本数据,记录了用于命名实体识别的任务。主要特征如下:...
    packageimg
  • 文本编码与TF-IDF权重计算数据集Encode-TFIDFDataset-damvantai

    2025年4月22日   

    文本编码与TF-IDF权重计算数据集Encode-TFIDFDataset-damvantai 数据来源:互联网公开数据 标签:文本处理,TF-IDF,数据集,自然语言处理,特征提取,机器学习,信息检索,文本分析 数据概述: 该数据集专注于文本编码与TF-IDF(词频-逆文档频率)权重计算,记录了文本数据经过处理后的特征向量。主要特征如下:...
    packageimg
  • 西班牙政治推特语料库2023-ricardomoya

    2025年4月22日   

    西班牙政治推特语料库2023-ricardomoya 数据来源:互联网公开数据 标签:推特,政治,西班牙,自然语言处理,NLP,机器学习,PSOE,PP,VOX,Unidas Podemos,Ciudadanos 数据概述: 本数据集包含来自西班牙主要政党(PSOE, PP, VOX, Unidas Podemos 和...
    packageimg
  • 德里推特数据集DelhiTweetsDataset-mlcovidresearch

    2025年4月22日   

    德里推特数据集DelhiTweetsDataset-mlcovidresearch 数据来源:互联网公开数据 标签:推特数据,社交媒体,数据分析,自然语言处理,城市研究,社会学,情感分析,机器学习 数据概述:该数据集包含来自德里的推特数据,记录了德里居民在社交媒体平台上的讨论和活动。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2022年。...
    packageimg
  • 法国财经新闻与股票市场情绪分析预测数据集-2018年11月至2021年3月-arcticgiant

    2025年4月22日   

    法国财经新闻与股票市场情绪分析预测数据集-2018年11月至2021年3月-arcticgiant 数据来源:互联网公开数据 标签:财经新闻,法国,股票市场,情绪分析,CAC40,预测,自然语言处理,时间序列,VADER,翻译 数据概述:...
    packageimg
  • 数据2021年5月Job-A-Thon竞赛数据集-makrovh

    2025年4月22日   

    2021年5月Job-A-Thon竞赛数据集-makrovh 数据来源:互联网公开数据 标签:招聘,求职,数据集,机器学习,自然语言处理,文本分析,预测模型,人才市场 数据概述: 该数据集包含了2021年5月Job-A-Thon竞赛的相关数据,主要记录了招聘和求职信息,旨在用于构建预测模型。主要特征如下:...
    packageimg
  • 斯瓦希里语语音数据集SwahiliTrainSplitDataset-rainmaker29

    2025年4月22日   

    斯瓦希里语语音数据集SwahiliTrainSplitDataset-rainmaker29 数据来源:互联网公开数据 标签:斯瓦希里语,语音识别,数据集,自然语言处理,机器学习,语音技术,人工智能,语言学 数据概述: 该数据集包含来自互联网公开的斯瓦希里语语音数据,主要用于语音识别和自然语言处理的研究。主要特征如下:...
    packageimg
  • 英语仇恨言论检测数据集EnglishHateSpeechDetectionDataset-charliegong

    2025年4月22日   

    英语仇恨言论检测数据集EnglishHateSpeechDetectionDataset-charliegong 数据来源:互联网公开数据 标签:仇恨言论,自然语言处理,文本分类,机器学习,情感分析,社交媒体,文本数据,数据集 数据概述: 该数据集包含了英语社交媒体平台上的文本数据,旨在用于仇恨言论的检测和分析。主要特征如下: 时间跨度:...
    packageimg
  • 意大利讽刺检测数据集ItalianSarcasmDetectionDataset-gioelefanelli

    2025年4月22日   

    意大利讽刺检测数据集ItalianSarcasmDetectionDataset-gioelefanelli 数据来源:互联网公开数据 标签:讽刺检测,自然语言处理,数据集,机器学习,文本分析,社交媒体,人工智能 数据概述:该数据集包含来自意大利社交媒体平台的数据,记录了用户发布的评论及其是否为讽刺的判断结果。主要特征如下:...
    packageimg
  • 情感分析比赛数据集IsemevalDataset-adityaraghuvanshi999

    2025年4月22日   

    情感分析比赛数据集IsemevalDataset-adityaraghuvanshi999 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,文本挖掘,机器学习,社交媒体,学术研究,信息检索 数据概述:该数据集来自情感分析比赛,主要记录了社交媒体上的文本数据及其对应的情感标签,适用于情感分析,自然语言处理等任务。主要特征如下:...
    packageimg
  • 互联网新闻摘要数据集HSXLNETSummaryDataset-gayatriilan

    2025年4月22日   

    互联网新闻摘要数据集HSXLNETSummaryDataset-gayatriilan 数据来源:互联网公开数据 标签:新闻摘要,数据集,自然语言处理,文本分析,机器学习,信息检索,媒体研究,互联网新闻 数据概述: 该数据集包含来自互联网新闻网站的新闻文章及其对应的摘要,适用于新闻摘要生成,文本摘要技术研究等任务。主要特征如下:...
    packageimg
  • 美国航空业情感分析数据集USAirlineSentimentsDataset-levii2375

    2025年4月22日   

    美国航空业情感分析数据集USAirlineSentimentsDataset-levii2375 数据来源:互联网公开数据 标签:航空业,情感分析,数据集,社交媒体,自然语言处理,客户反馈,市场研究,社会媒体分析 数据概述:该数据集包含来自推特的关于美国各大航空公司客户评论的数据,记录了客户对航空公司服务的情感评价。主要特征如下:...
    packageimg
  • 电子邮件垃圾邮件检测数据集EmailSpamDetectionDataset-devaanshpuri

    2025年4月22日   

    电子邮件垃圾邮件检测数据集EmailSpamDetectionDataset-devaanshpuri 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,数据集,文本分类,机器学习,自然语言处理,信息安全,数据分析 数据概述: 该数据集包含来自电子邮件系统的邮件数据,记录了邮件的分类标签和内容特征。主要特征如下:...
    packageimg