找到11,786个数据集

标签: 自然语言处理

过滤结果
  • 预训练RoBERTa-base模型预测结果数据集-mathislucka

    2025年4月22日   

    预训练RoBERTa-base模型预测结果数据集-mathislucka 数据来源:互联网公开数据 标签:自然语言处理,文本分析,情感分析,机器翻译,文本分类,模型预测,RoBERTa,数据集 数据概述: 该数据集包含了基于预训练RoBERTa-base模型对文本数据的预测结果。主要特征如下:...
    packageimg
  • 突尼斯问答数据集TunisiaQ-ADataset-anismarrouchi

    2025年4月22日   

    突尼斯问答数据集TunisiaQ-ADataset-anismarrouchi 数据来源:互联网公开数据 标签:突尼斯,问答,自然语言处理,文本分析,信息检索,阿拉伯语,数据集,文化 数据概述: 该数据集包含来自突尼斯的问答数据,主要记录了关于突尼斯文化,历史,社会,旅游等领域的问题和答案。主要特征如下:...
    packageimg
  • 多语言仇恨言论检测数据集MultilingualHateSpeechDetectionDataset-fida5073

    2025年4月22日   

    多语言仇恨言论检测数据集MultilingualHateSpeechDetectionDataset-fida5073 数据来源:互联网公开数据 标签:仇恨言论,多语言,自然语言处理,文本分类,机器学习,情感分析,社交媒体,数据集 数据概述: 该数据集包含来自社交媒体平台的多语言文本数据,旨在用于仇恨言论的检测和分类。主要特征如下:...
    packageimg
  • 法国地理位置自然语言处理数据集FrenchLocationsNLPDataset-waelfezari

    2025年4月22日   

    法国地理位置自然语言处理数据集FrenchLocationsNLPDataset-waelfezari 数据来源:互联网公开数据 标签:自然语言处理,地理位置,数据集,文本分析,机器学习,地理信息系统,语言学,信息检索 数据概述:该数据集包含来自互联网公开资源的法国地理位置相关文本数据,适用于自然语言处理,地理位置信息提取等任务。主要特征如下:...
    packageimg
  • 聚类后句子数据集SentencesAfterClusteringDataset-mrqian0509

    2025年4月22日   

    聚类后句子数据集SentencesAfterClusteringDataset-mrqian0509 数据来源:互联网公开数据 标签:文本分析,数据集,聚类分析,自然语言处理,机器学习,文本挖掘,数据分析,人工智能 数据概述:该数据集包含通过聚类算法处理后生成的句子数据,记录了不同类别或主题的文本句子。主要特征如下:...
    packageimg
  • 虚假新闻文本识别数据集FakedditText50kDataset-rajatdhanuka

    2025年4月22日   

    虚假新闻文本识别数据集FakedditText50kDataset-rajatdhanuka 数据来源:互联网公开数据 标签:虚假新闻,文本识别,数据集,自然语言处理,机器学习,情感分析,信息传播,文本分类 数据概述: 该数据集包含来自Fakeddit项目的文本数据,记录了50,000条新闻文本及其真实性标签。主要特征如下:...
    packageimg
  • 推特训练数据集TwitterTrainingDataCSVDataset-compellingdemigod

    2025年4月22日   

    推特训练数据集TwitterTrainingDataCSVDataset-compellingdemigod 数据来源:互联网公开数据 标签:社交媒体,文本分析,数据集,机器学习,情感分析,自然语言处理,数据挖掘,文本分类 数据概述: 该数据集包含来自推特平台的公开文本数据,记录了用户发布的推文及其相关信息。主要特征如下:...
    packageimg
  • 计算语言学与语音学领域论文摘要数据集AbstractsfromarXiv-orgunderCSLGCategory-ajiiscbanglore

    2025年4月22日   

    计算语言学与语音学领域论文摘要数据集AbstractsfromarXiv-orgunderCSLGCategory-ajiiscbanglore 数据来源:互联网公开数据 标签:计算语言学,语音学,数据集,学术研究,自然语言处理,文本分析,机器学习,学术论文 数据概述:...
    packageimg
  • 情感分类社交媒体评论数据集SentimentClassificationSocialMediaCommentsDataset-chandan999

    2025年4月22日   

    情感分类社交媒体评论数据集SentimentClassificationSocialMediaCommentsDataset-chandan999 数据来源:互联网公开数据 标签:情感分析,数据集,社交媒体,文本分类,自然语言处理,机器学习,文本挖掘,社会学研究 数据概述:...
    packageimg
  • 大规模语言模型训练数据集LargeLanguageModelTrainingData-z1qz1q

    2025年4月22日   

    大规模语言模型训练数据集LargeLanguageModelTrainingData-z1qz1q 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本数据,语言模型,预训练,文本生成,深度学习 数据概述: 该数据集包含大规模的文本数据,主要用于训练大型语言模型。主要特征如下:...
    packageimg
  • 全球抗议活动关键词数据集GDELTUnrestSAKeywordsDataset-liadperetz

    2025年4月22日   

    全球抗议活动关键词数据集GDELTUnrestSAKeywordsDataset-liadperetz 数据来源:互联网公开数据 标签:抗议活动,关键词,全球,事件分析,文本挖掘,自然语言处理,社会学,政治学 数据概述: 该数据集基于全球事件,语言和趋势数据库(GDELT),包含了与全球抗议活动相关的关键词信息。主要特征如下:...
    packageimg
  • IMDb电影评分与评论数据集IMDbMovieRatingsandReviewsDataset-archanakumari26

    2025年4月22日   

    IMDb电影评分与评论数据集IMDbMovieRatingsandReviewsDataset-archanakumari26 数据来源:互联网公开数据 标签:电影评分,电影评论,数据集,自然语言处理,情感分析,数据挖掘,机器学习,娱乐产业 数据概述:...
    packageimg
  • DeBERTa模型训练K折交叉验证数据集-lakshit95

    2025年4月22日   

    DeBERTa模型训练K折交叉验证数据集-lakshit95 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,DeBERTa,K折交叉验证,模型训练,NLP 数据概述: 该数据集用于训练和评估DeBERTa模型,采用了K折交叉验证(K-fold cross-validation)方法。主要特征如下: 时间跨度:...
    packageimg
  • 埃博拉-疟疾-脑膜炎文本挖掘数据集-kandahugues

    2025年4月22日   

    埃博拉-疟疾-脑膜炎文本挖掘数据集-kandahugues 数据来源:互联网公开数据 标签:文本挖掘,疾病,埃博拉,疟疾,脑膜炎,医学,自然语言处理,疫情分析 数据概述: 该数据集包含了关于埃博拉,疟疾和脑膜炎三种疾病的文本数据,旨在用于文本挖掘和信息提取研究。主要特征如下:...
    packageimg
  • Kompas新闻事实核查数据集CEK-FaktaKompasDataset-aginanjar

    2025年4月22日   

    Kompas新闻事实核查数据集CEK-FaktaKompasDataset-aginanjar 数据来源:互联网公开数据 标签:新闻事实核查,数据集,信息真实性,新闻分析,机器学习,自然语言处理,媒体研究,文本分析 数据概述: 该数据集包含来自印尼Kompas新闻网站的事实核查数据,记录了新闻内容的真实性核查结果。主要特征如下:...
    packageimg
  • 语言翻译数据集LanguageTranslationDataset-rohitwaldekar

    2025年4月22日   

    语言翻译数据集LanguageTranslationDataset-rohitwaldekar 数据来源:互联网公开数据 标签:语言翻译,数据集,机器学习,自然语言处理,文本分析,多语言,人工智能,数据挖掘 数据概述: 该数据集包含来自多个语言翻译项目的数据,记录了不同语言之间的文本翻译对。主要特征如下:...
    packageimg
  • 用户电影评论数据集UserMovieReviewDataset-vijayakowsi

    2025年4月22日   

    用户电影评论数据集UserMovieReviewDataset-vijayakowsi 数据来源:互联网公开数据 标签:电影评论,数据集,情感分析,自然语言处理,用户行为,数据挖掘,商业智能,机器学习 数据概述: 该数据集包含来自互联网用户对电影的评价数据,记录了用户对电影的主观评价和评分。主要特征如下:...
    packageimg
  • 印地语推文反讽检测数据集HindiTweetsDatasetforSarcasmDetection-pragyakatyayan

    2025年4月22日   

    印地语推文反讽检测数据集HindiTweetsDatasetforSarcasmDetection-pragyakatyayan 数据来源:互联网公开数据 标签:印地语,社交媒体,推文分析,反讽检测,自然语言处理,情感分析,机器学习,文本分类 数据概述: 该数据集包含来自印地语社交媒体平台的推文数据,专门用于反讽检测任务。主要特征如下:...
    packageimg
  • Mercari商品价格预测数据集MercariSubmission3-ProductPricePredictionDataset-niranjanmaisnam

    2025年4月22日   

    Mercari商品价格预测数据集MercariSubmission3-ProductPricePredictionDataset-niranjanmaisnam 数据来源:互联网公开数据 标签:电子商务,价格预测,数据集,机器学习,零售业,自然语言处理,商品分类,商业智能 数据概述:...
    packageimg
  • 关键词提取与文本分析数据集PlusKeywordDataset-chaewonjeon1116

    2025年4月22日   

    关键词提取与文本分析数据集PlusKeywordDataset-chaewonjeon1116 数据来源:互联网公开数据 标签:自然语言处理,关键词提取,文本分析,数据集,机器学习,信息检索,文本挖掘,语义分析 数据概述: 该数据集包含来自多个公开来源的文本数据,专注于关键词提取和文本分析任务。主要特征如下:...
    packageimg