找到940个数据集

标签: 文本数据

过滤结果
  • 自然语言处理项目原始数据集-emilygreen8

    2025年4月23日   

    自然语言处理项目原始数据集-emilygreen8 数据来源:互联网公开数据 标签:自然语言处理,NLP,数据集,文本数据,语料库,数据预处理,机器学习,文本分析 数据概述: 该数据集包含用于自然语言处理(NLP)项目的原始文本数据,涵盖多种文本来源和语言。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于各个子数据集的发布时间。...
    packageimg
  • 推特情感分析增强数据集-推文情感与文本增强-mks2192

    2025年4月23日   

    推特情感分析增强数据集-推文情感与文本增强-mks2192 数据来源:互联网公开数据 标签:推特,情感分析,文本挖掘,自然语言处理,数据增强,情感分类,文本数据 数据概述:...
    packageimg
  • 跨编码器训练数据4K数据集Cross-EncoderTrainingData4KDataset-ictunivers

    2025年4月23日   

    跨编码器训练数据4K数据集Cross-EncoderTrainingData4KDataset-ictunivers 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,跨编码器,语义理解,机器学习,深度学习,文本匹配 数据概述: 该数据集包含用于训练跨编码器模型的大量文本数据,旨在提升模型在语义理解和文本匹配方面的性能。主要特征如下:...
    packageimg
  • 大规模语言模型训练数据集LargeLanguageModelTrainingData-z1qz1q

    2025年4月22日   

    大规模语言模型训练数据集LargeLanguageModelTrainingData-z1qz1q 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本数据,语言模型,预训练,文本生成,深度学习 数据概述: 该数据集包含大规模的文本数据,主要用于训练大型语言模型。主要特征如下:...
    packageimg
  • BERT情感分析数据集-endofnight17j03

    2025年4月22日   

    BERT情感分析数据集-endofnight17j03 数据来源:互联网公开数据 标签:情感分析,自然语言处理,文本数据,BERT,机器学习,情感分类,文本挖掘,NLP 数据概述: 该数据集包含用于情感分析的文本数据,旨在训练和评估基于BERT(Bidirectional Encoder Representations from...
    packageimg
  • 金融时报FT财经新闻文章情感分析验证数据集-2023年5月20日-duckycode

    2025年4月22日   

    金融时报FT财经新闻文章情感分析验证数据集-2023年5月20日-duckycode 数据来源:互联网公开数据 标签:金融时报,FT,财经新闻,情感分析,文本数据,新闻文章,验证集,CSV 数据概述: 本数据集包含2023年5月20日从《金融时报》(Financial...
    packageimg
  • Reddit笑话数据集RedditJokesDataset-vishnuprksh

    2025年4月22日   

    Reddit笑话数据集RedditJokesDataset-vishnuprksh 数据来源:互联网公开数据 标签:笑话,Reddit,文本数据,自然语言处理,情感分析,社交媒体,机器学习,幽默 数据概述: 该数据集包含来自Reddit平台的笑话数据,记录了用户发布的各种类型的笑话及其相关信息。主要特征如下:...
    packageimg
  • 英语仇恨言论检测数据集EnglishHateSpeechDetectionDataset-charliegong

    2025年4月22日   

    英语仇恨言论检测数据集EnglishHateSpeechDetectionDataset-charliegong 数据来源:互联网公开数据 标签:仇恨言论,自然语言处理,文本分类,机器学习,情感分析,社交媒体,文本数据,数据集 数据概述: 该数据集包含了英语社交媒体平台上的文本数据,旨在用于仇恨言论的检测和分析。主要特征如下: 时间跨度:...
    packageimg
  • YouTube视频评论文本数据数据集-counito27

    2025年4月22日   

    YouTube视频评论文本数据数据集-counito27 数据来源:互联网公开数据 标签:YouTube,评论,文本数据,自然语言处理,情感分析,机器学习,社交媒体,数据挖掘 数据概述: 该数据集包含来自YouTube平台的视频评论数据,记录了用户对不同视频的评论内容。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于数据集的创建时间。...
    packageimg
  • 临床综合征疾病文档标注数据集2023-muhammadimran112233

    2025年4月22日   

    临床综合征疾病文档标注数据集2023-muhammadimran112233 数据来源:互联网公开数据 标签:临床文档,综合征,疾病,医学,标注,文本数据,神经学,放射学,出院总结,内科,消化内科 数据概述:...
    packageimg
  • 芭比电影IMDB影评数据集-2023年-ibrahimonmars

    2025年4月22日   

    芭比电影IMDB影评数据集-2023年-ibrahimonmars 数据来源:互联网公开数据 标签:IMDB,影评,芭比电影,情感分析,文本数据,用户反馈,电影评价 数据概述:...
    packageimg
  • TikTokTokopedia卖家中心用户评论情感分析数据集-wildanamruhidayat

    2025年4月22日   

    TikTokTokopedia卖家中心用户评论情感分析数据集-wildanamruhidayat 数据来源:互联网公开数据 标签:TikTok, Tokopedia, 卖家中心, 用户评论, 情感分析, 电商, 印尼语, 文本数据, 情绪识别 数据概述: 本数据集包含来自TikTok...
    packageimg
  • 航空公司情绪分析数据集-jaskarancr

    2025年4月22日   

    航空公司情绪分析数据集-jaskarancr 数据来源:互联网公开数据 标签:情感分析,航空公司,文本数据,自然语言处理,机器学习,舆情分析,社交媒体,客户反馈 数据概述: 该数据集包含来自Twitter的关于航空公司的推文,记录了乘客对不同航空公司的情绪和观点。主要特征如下: 时间跨度:数据记录的时间范围不确定,但包含了大量社交媒体推文。...
    packageimg
  • 孟加拉语情感词典情感分析数据集-hasuu234

    2025年4月22日   

    孟加拉语情感词典情感分析数据集-hasuu234 数据来源:互联网公开数据 标签:孟加拉语,情感分析,自然语言处理,情感词典,文本数据,词汇,情感极性 数据概述:...
    packageimg
  • 英国亚马逊手机评论情感分析数据集-2023-arun9872

    2025年4月22日   

    英国亚马逊手机评论情感分析数据集-2023-arun9872 数据来源:互联网公开数据 标签:亚马逊,手机,评论,情感分析,用户评价,文本数据,星级评分,UK 数据概述: 本数据集包含了英国亚马逊平台上针对手机产品的用户评论数据,旨在用于情感分析模型的训练与评估。 数据集的核心内容是用户撰写的评论文本以及对应的星级评分。...
    packageimg
  • 苹果应用商店Choices游戏评论情感分析数据集-2023-cosmokay

    2025年4月22日   

    苹果应用商店Choices游戏评论情感分析数据集-2023-cosmokay 数据来源:互联网公开数据 标签:Choices游戏,评论,情感分析,苹果应用商店,游戏评论,文本数据,用户反馈,游戏体验 数据概述:...
    packageimg
  • 工业控制系统报警文本数据集

    2025年4月22日   

    工业控制系统报警文本数据集 数据来源:互联网公开数据 标签:工业控制系统,报警管理,文本数据,工业过程,异常检测,工业安全,故障诊断 数据概述 本数据集包含工业控制系统(Industrial Control System,ICS)的报警文本记录,数据来源于Gianluca Manca(2020年)发布的"Tennessee-Eastman-...
    packageimg
  • 英语到西班牙语翻译数据集English-to-SpanishTranslationDataset-hareeeshhh

    2025年4月22日   

    英语到西班牙语翻译数据集English-to-SpanishTranslationDataset-hareeeshhh 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,翻译模型,语言学,深度学习,文本数据,英语西班牙语 数据概述: 该数据集包含英语到西班牙语的翻译对,记录了英语文本及其对应的西班牙语翻译。主要特征如下:...
    packageimg
  • 维基百科条目提取数据集Wiki-ExtractsDataset-davandenakker

    2025年4月22日   

    维基百科条目提取数据集Wiki-ExtractsDataset-davandenakker 数据来源:互联网公开数据 标签:维基百科,文本数据,数据集,自然语言处理,机器学习,信息检索,知识图谱,数据挖掘 数据概述: 该数据集包含从维基百科提取的条目数据,记录了维基百科中各类主题的文本信息。主要特征如下:...
    packageimg
  • 网络热梗图片文字识别数据集-疫情与美国政治相关-2020至2023年-yogesh239

    2025年4月22日   

    网络热梗图片文字识别数据集-疫情与美国政治相关-2020至2023年-yogesh239 数据来源:互联网公开数据 标签:热梗,OCR,疫情,美国政治,图像识别,文本数据,社会现象,数据分析 数据概述:...
    packageimg