找到611个数据集

标签: NLP

过滤结果
  • 英印机器翻译练习数据集-arunmohan003

    2025年4月22日   

    英印机器翻译练习数据集-arunmohan003 数据来源:互联网公开数据 标签:机器翻译,英印翻译,语言数据,练习数据,自然语言处理,NLP,样本数据 数据概述:...
    packageimg
  • 西班牙政治推特语料库2023-ricardomoya

    2025年4月22日   

    西班牙政治推特语料库2023-ricardomoya 数据来源:互联网公开数据 标签:推特,政治,西班牙,自然语言处理,NLP,机器学习,PSOE,PP,VOX,Unidas Podemos,Ciudadanos 数据概述: 本数据集包含来自西班牙主要政党(PSOE, PP, VOX, Unidas Podemos 和...
    packageimg
  • Spacy测试数据集SpacyTestDataset-hhhurenyuan

    2025年4月22日   

    Spacy测试数据集SpacyTestDataset-hhhurenyuan 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,NLP,文本分类,语言模型,人工智能 数据概述: 该数据集为 Spacy 项目的测试数据集,主要记录了用于自然语言处理任务的文本数据。主要特征如下: 时间跨度:数据记录的时间范围未知。...
    packageimg
  • Spotify巴西热门歌词数据集-1947年至今-vitoriafirmino

    2025年4月22日   

    Spotify巴西热门歌词数据集-1947年至今-vitoriafirmino 数据来源:互联网公开数据 标签:歌词,巴西,Spotify,音乐,流行文化,语言学,NLP,情感分析,音乐趋势,时间序列 数据概述:...
    packageimg
  • 苹果2024秋季发布会iPhone16及相关产品发布内容转录数据集-nuhmanpk

    2025年4月22日   

    苹果2024秋季发布会iPhone16及相关产品发布内容转录数据集-nuhmanpk 数据来源:互联网公开数据 标签:苹果,发布会,文本转录,语音识别,情感分析,关键词提取,NLP,产品发布,Apple Watch,AirPods,iPhone 16,Apple Intelligence 数据概述: 本数据集为2024年苹果秋季发布会(Apple...
    packageimg
  • 数据2022年股市崩盘相关推特情感分析数据集-tejasurya

    2025年4月22日   

    2022年股市崩盘相关推特情感分析数据集-tejasurya 数据来源:互联网公开数据 标签:股市崩盘,推特,情感分析,NLP,金融新闻,2022年,市场趋势,话题建模,BERT 数据概述:...
    packageimg
  • Linux系统日志分析数据集2021-ggsri123

    2025年4月22日   

    Linux系统日志分析数据集2021-ggsri123 数据来源:互联网公开数据 标签:Linux,日志,系统监控,数据分析,异常检测,事件识别,多分类,模板匹配,NLP,开源数据 数据概述: 本数据集包含从LogPai...
    packageimg
  • 特朗普总统政治集会演讲稿数据集-2017-2020年-tanpengshi

    2025年4月22日   

    特朗普总统政治集会演讲稿数据集-2017-2020年-tanpengshi 数据来源:互联网公开数据 标签:特朗普,政治,集会,演讲稿,文本,NLP,自然语言处理,美国大选,言论分析,数据挖掘 数据概述:...
    packageimg
  • 土耳其语患者医生问答数据集-iCliniq平台-2024-kaayra2000

    2025年4月22日   

    土耳其语患者医生问答数据集-iCliniq平台-2024-kaayra2000 数据来源:互联网公开数据 标签:患者问答,医生回复,医疗咨询,土耳其语,NLP,自然语言处理,医疗研究,医学教育 数据概述: 本数据集收录了iCliniq平台上真实患者提出的医疗问题及其医生回复的土耳其语翻译版本。该数据集源于iCliniq Medical...
    packageimg
  • 推特情感分析数据集TweetSentimentExtractionDataset-tunguz

    2025年4月22日   

    推特情感分析数据集TweetSentimentExtractionDataset-tunguz 数据来源:互联网公开数据 标签:推特,情感分析,自然语言处理,文本分类,机器学习,情感提取,社交媒体,NLP 数据概述: 该数据集包含来自推特(Twitter)的文本数据,旨在用于情感分析和情感提取任务。主要特征如下:...
    packageimg
  • 医疗文本PHI受保护健康信息标注数据集-vijayakashv03

    2025年4月22日   

    医疗文本PHI受保护健康信息标注数据集-vijayakashv03 数据来源:互联网公开数据 标签:PHI,医疗文本,数据标注,隐私保护,NLP,自然语言处理,文本处理,数据安全,敏感信息,信息脱敏 数据概述: 本数据集专为敏感信息脱敏设计,特别是受保护健康信息(PHI, Protected Health...
    packageimg
  • 亚马逊客户产品评价情感分类数据集-2021年-uday756

    2025年4月22日   

    亚马逊客户产品评价情感分类数据集-2021年-uday756 数据来源:互联网公开数据 标签:亚马逊,客户评价,情感分析,产品评价,自然语言处理,NLP,文本分类 数据概述:...
    packageimg
  • Yektanet波斯语网页文本主题分类数据集

    2025年4月22日   

    Yektanet波斯语网页文本主题分类数据集 数据来源:互联网公开数据 标签:波斯语,NLP,文本分类,机器学习,网页数据,主题识别,自然语言处理 数据概述:...
    packageimg
  • 垃圾邮件过滤-电子邮件内容分类数据集-yashpaloswal

    2025年4月22日   

    垃圾邮件过滤-电子邮件内容分类数据集-yashpaloswal 数据来源:互联网公开数据 标签:自然语言处理,NLP,文本分类,垃圾邮件,电子邮件,文本数据,机器学习,分类模型,邮件过滤,SPAM,HAM 数据概述:...
    packageimg
  • 推特言论分类-有害言论与无害言论识别数据集-grodzina

    2025年4月22日   

    推特言论分类-有害言论与无害言论识别数据集-grodzina 数据来源:互联网公开数据 标签:推特,有害言论,无害言论,自然语言处理,NLP,文本分类,社交媒体分析 数据概述:...
    packageimg
  • LLM基线模型评测数据集-aditya21511

    2025年4月22日   

    LLM基线模型评测数据集-aditya21511 数据来源:互联网公开数据 标签:大语言模型,LLM,基线模型,评测,NLP,自然语言处理,基准测试,性能评估 数据概述: 该数据集包含用于评估大语言模型(LLM)性能的基线模型评测数据,用于衡量LLM在不同任务上的表现。主要特征如下: 时间跨度:数据集涵盖了当前LLM发展阶段的多个时间点。...
    packageimg
  • 正则表达式与文本挖掘清理后的NLP数据集-janiscorona

    2025年4月22日   

    正则表达式与文本挖掘清理后的NLP数据集-janiscorona 数据来源:互联网公开数据 标签:自然语言处理,文本挖掘,正则表达式,数据清洗,NLP,数据集,文本分析,数据预处理 数据概述: 该数据集包含了经过清洗和预处理的文本数据,主要用于自然语言处理(NLP)和文本挖掘任务。主要特征如下:...
    packageimg
  • 英文单词全集数据集-lennartluik

    2025年4月22日   

    英文单词全集数据集-lennartluik 数据来源:互联网公开数据 标签:英文单词,词汇库,英语学习,语言研究,自然语言处理,NLP 数据概述: 本数据集收录了《dwyl/english-...
    packageimg
  • 情感分析数据集EmotionsData-rukenmissonnier

    2025年4月22日   

    情感分析数据集EmotionsData-rukenmissonnier 数据来源:互联网公开数据 标签:情感分析,文本数据,数据集,自然语言处理,机器学习,情感识别,情绪分类,NLP 数据概述: 该数据集包含用于情感分析的文本数据,记录了各种文本片段及其对应的情感标签。主要特征如下: 时间跨度:...
    packageimg
  • 命名实体识别数据集NER-animeshnareda

    2025年4月22日   

    命名实体识别数据集NER-animeshnareda 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,文本分析,机器学习,信息抽取,人工智能,NLP 数据概述:该数据集包含来自多个领域的文本数据,用于训练和评估命名实体识别模型。主要特征如下: 时间跨度:数据记录的时间范围不固定,涵盖了不同时期的新闻,文章和报告等。...
    packageimg