找到11,864个数据集

标签: 自然语言处理

过滤结果
  • 语言生成器合成文本数据集

    2025年4月25日   

    语言生成器合成文本数据集 数据来源:互联网公开数据 标签:自然语言处理,文本生成,语言模型训练,合成数据,数据增强,对话模拟,错误注入 数据概述: 本数据集是由Python工具Linguistic...
    packageimg
  • 泰米尔语仇恨言论数据集TamilHateSpeechDataset-karnatiprash

    2025年4月25日   

    泰米尔语仇恨言论数据集TamilHateSpeechDataset-karnatiprash 数据来源:互联网公开数据 标签:仇恨言论,自然语言处理,文本分析,机器学习,情感分析,泰米尔语,社交媒体,语言学 数据概述: 该数据集包含了来自社交媒体平台的泰米尔语文本数据,主要用于仇恨言论的检测与分析。主要特征如下:...
    packageimg
  • 电商店铺评论分析数据集DaconShopReviewDataset-emphymachine

    2025年4月25日   

    电商店铺评论分析数据集DaconShopReviewDataset-emphymachine 数据来源:互联网公开数据 标签:电商行业,评论分析,数据集,情感分析,文本挖掘,机器学习,自然语言处理,消费者行为 数据概述: 该数据集包含来自电商平台的店铺评论数据,记录了消费者对商品和店铺的评价信息。主要特征如下:...
    packageimg
  • DAIGTv4训练数据集-LLM生成文本与真实文本混合数据集

    2025年4月25日   

    DAIGTv4训练数据集-LLM生成文本与真实文本混合数据集 数据来源:互联网公开数据 标签:自然语言处理,文本生成,机器学习,LLM,训练数据,论文写作,评估,模型训练 数据概述: 本数据集是DAIGT(Detect AI Generated...
    packageimg
  • 垃圾邮件过滤数据集SpamData1-dafniskrasniqi

    2025年4月25日   

    垃圾邮件过滤数据集SpamData1-dafniskrasniqi 数据来源:互联网公开数据 标签:垃圾邮件,文本分类,自然语言处理,机器学习,数据集,邮件分析,信息检索,恶意内容检测 数据概述: 该数据集包含了大量电子邮件数据,用于垃圾邮件的检测与过滤。主要特征如下: 时间跨度:数据记录的时间跨度不明确,但涵盖了电子邮件发展早期至今的时期。...
    packageimg
  • Shopee和Zoom应用用户评论数据集ShopeeandZoomAppUserReviewsDataset-yasinarilmustofa

    2025年4月25日   

    Shopee和Zoom应用用户评论数据集ShopeeandZoomAppUserReviewsDataset-yasinarilmustofa 数据来源:互联网公开数据 标签:用户评论,数据集,电子商务,远程会议,自然语言处理,市场分析,用户体验,消费者行为 数据概述:...
    packageimg
  • 新闻头条摘要数据集MinorNewsHeadlinesDataset-adya07

    2025年4月25日   

    新闻头条摘要数据集MinorNewsHeadlinesDataset-adya07 数据来源:互联网公开数据 标签:新闻,头条,文本分析,自然语言处理,数据集,摘要,情感分析,信息检索 数据概述: 该数据集包含了来自新闻网站的头条新闻摘要,记录了新闻标题和对应的简短摘要。主要特征如下: 时间跨度:数据记录的时间范围未知,但涵盖了较长的时间段。...
    packageimg
  • 论文数据集EssayDataDataset-shenzeyuan

    2025年4月25日   

    论文数据集EssayDataDataset-shenzeyuan 数据来源:互联网公开数据 标签:教育,学术研究,数据集,文本分析,自然语言处理,机器学习,文本分类,写作评估 数据概述: 该数据集包含来自学术机构和教育平台的论文数据,记录了各类学术论文的文本内容和相关元数据。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • 推特多样性推文数据集DiverseTweetsDataset-johnsonubah

    2025年4月25日   

    推特多样性推文数据集DiverseTweetsDataset-johnsonubah 数据来源:互联网公开数据 标签:推特,社交媒体,数据集,文本分析,自然语言处理,情感分析,多样性,舆情分析 数据概述: 该数据集包含来自推特(Twitter)的公开推文数据,旨在促进对社交媒体上多样性内容的分析和研究。主要特征如下:...
    packageimg
  • 英语词性标注数据集

    2025年4月25日   

    英语词性标注数据集 数据来源:互联网公开数据 标签:自然语言处理,词性标注,英语语言,词法分析,文本归一化,Part-Of-Speech,POS标签 数据概述...
    packageimg
  • 推特文本情感分析数据集TwitterTweetNLPDataset-diwakarsehgal

    2025年4月25日   

    推特文本情感分析数据集TwitterTweetNLPDataset-diwakarsehgal 数据来源:互联网公开数据 标签:社交媒体,情感分析,自然语言处理,文本挖掘,机器学习,推特,NLP,情绪识别 数据概述: 该数据集包含来自推特(Twitter)的推文数据,用于情感分析和自然语言处理任务。主要特征如下:...
    packageimg
  • 电影情感分析数据集SentimentAnalysisforFilmsDataset-1-niranjansnambiar

    2025年4月25日   

    电影情感分析数据集SentimentAnalysisforFilmsDataset-1-niranjansnambiar 数据来源:互联网公开数据 标签:情感分析,电影评论,自然语言处理,数据集,机器学习,文本挖掘,情感识别,数据科学 数据概述: 该数据集包含来自电影评论网站的电影评论数据,记录了用户对电影的情感评价。主要特征如下:...
    packageimg
  • palm作文生成评估数据集PalmEssayGenItr1Dataset-amankumartak

    2025年4月25日   

    palm作文生成评估数据集PalmEssayGenItr1Dataset-amankumartak 数据来源: 互联网公开数据 标签:作文生成,自然语言处理,数据集,机器学习,文本生成,语言模型,教育技术,评估研究 数据概述: 该数据集包含来自Palm作文生成项目(Palm Essay Generation...
    packageimg
  • 垃圾邮件检测数据集SpamMailDetectionDataset-saksham177

    2025年4月25日   

    垃圾邮件检测数据集SpamMailDetectionDataset-saksham177 数据来源:互联网公开数据 标签:垃圾邮件,邮件检测,数据集,自然语言处理,文本分类,机器学习,信息安全,风险管理 数据概述: 该数据集包含来自互联网的邮件数据,用于垃圾邮件的检测与分类。主要特征如下: 时间跨度:...
    packageimg
  • ABC新闻日期文本数据集ABCNewsDateTextDataset-psnayakitiiests

    2025年4月25日   

    ABC新闻日期文本数据集ABCNewsDateTextDataset-psnayakitiiests 数据来源:互联网公开数据 标签:新闻文本,数据集,时间序列,文本分析,自然语言处理,媒体研究,机器学习,数据挖掘 数据概述: 该数据集包含来自ABC新闻的文本数据,记录了新闻文章的发布日期和主要内容。主要特征如下:...
    packageimg
  • Facebook经济新闻数据集-mochdwifebrianto

    2025年4月25日   

    Facebook经济新闻数据集-mochdwifebrianto 数据来源:互联网公开数据 标签:经济新闻,社交媒体,数据集,文本分析,自然语言处理,情感分析,金融科技,新闻传播 数据概述: 该数据集包含了来自Facebook平台的经济新闻数据,记录了与经济相关的文章和帖子。主要特征如下: 时间跨度:数据记录的时间范围为不确定,取决于数据集的创建时间。...
    packageimg
  • 谷歌应用商店评论情感分析数据集SentimentAnalysisGooglePlayDataset-huangkailong

    2025年4月25日   

    谷歌应用商店评论情感分析数据集SentimentAnalysisGooglePlayDataset-huangkailong 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本挖掘,应用商店,用户评论,大数据 数据概述:...
    packageimg
  • 愤怒情绪识别数据集AngerDataset-dianaspahieva

    2025年4月25日   

    愤怒情绪识别数据集AngerDataset-dianaspahieva 数据来源:互联网公开数据 标签:情感分析,数据集,机器学习,情绪识别,心理学,自然语言处理,计算机科学,人工智能 数据概述: 该数据集包含来自公开来源的文本和语音数据,记录了表达愤怒情绪的样本。主要特征如下: 时间跨度:数据记录的时间范围不明确,主要取决于数据来源的时间分布。...
    packageimg
  • 越南医学问答数据集Kalapa-VietMedQADataset-quangphm

    2025年4月25日   

    越南医学问答数据集Kalapa-VietMedQADataset-quangphm 数据来源:互联网公开数据 标签:医学问答,数据集,自然语言处理,人工智能,医学信息,越南语,机器学习,健康咨询 数据概述: 该数据集包含来自越南医学领域的问答数据,记录了医学知识问答的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。...
    packageimg
  • 马拉地语微调数据集MarathiFine-tuningDataDataset-suramyajadhav

    2025年4月25日   

    马拉地语微调数据集MarathiFine-tuningDataDataset-suramyajadhav 数据来源:互联网公开数据 标签:自然语言处理,文本数据,机器学习,语言模型,数据集,多语言,语言微调,数据训练 数据概述: 该数据集包含马拉地语的文本数据,主要用作自然语言处理任务中的语言模型微调。主要特征如下:...
    packageimg