-
语言生成器合成文本数据集
语言生成器合成文本数据集 数据来源:互联网公开数据 标签:自然语言处理,文本生成,语言模型训练,合成数据,数据增强,对话模拟,错误注入 数据概述: 本数据集是由Python工具Linguistic... -
泰米尔语仇恨言论数据集TamilHateSpeechDataset-karnatiprash
泰米尔语仇恨言论数据集TamilHateSpeechDataset-karnatiprash 数据来源:互联网公开数据 标签:仇恨言论,自然语言处理,文本分析,机器学习,情感分析,泰米尔语,社交媒体,语言学 数据概述: 该数据集包含了来自社交媒体平台的泰米尔语文本数据,主要用于仇恨言论的检测与分析。主要特征如下:... -
电商店铺评论分析数据集DaconShopReviewDataset-emphymachine
电商店铺评论分析数据集DaconShopReviewDataset-emphymachine 数据来源:互联网公开数据 标签:电商行业,评论分析,数据集,情感分析,文本挖掘,机器学习,自然语言处理,消费者行为 数据概述: 该数据集包含来自电商平台的店铺评论数据,记录了消费者对商品和店铺的评价信息。主要特征如下:... -
DAIGTv4训练数据集-LLM生成文本与真实文本混合数据集
DAIGTv4训练数据集-LLM生成文本与真实文本混合数据集 数据来源:互联网公开数据 标签:自然语言处理,文本生成,机器学习,LLM,训练数据,论文写作,评估,模型训练 数据概述: 本数据集是DAIGT(Detect AI Generated... -
垃圾邮件过滤数据集SpamData1-dafniskrasniqi
垃圾邮件过滤数据集SpamData1-dafniskrasniqi 数据来源:互联网公开数据 标签:垃圾邮件,文本分类,自然语言处理,机器学习,数据集,邮件分析,信息检索,恶意内容检测 数据概述: 该数据集包含了大量电子邮件数据,用于垃圾邮件的检测与过滤。主要特征如下: 时间跨度:数据记录的时间跨度不明确,但涵盖了电子邮件发展早期至今的时期。... -
Shopee和Zoom应用用户评论数据集ShopeeandZoomAppUserReviewsDataset-yasinarilmustofa
Shopee和Zoom应用用户评论数据集ShopeeandZoomAppUserReviewsDataset-yasinarilmustofa 数据来源:互联网公开数据 标签:用户评论,数据集,电子商务,远程会议,自然语言处理,市场分析,用户体验,消费者行为 数据概述:... -
新闻头条摘要数据集MinorNewsHeadlinesDataset-adya07
新闻头条摘要数据集MinorNewsHeadlinesDataset-adya07 数据来源:互联网公开数据 标签:新闻,头条,文本分析,自然语言处理,数据集,摘要,情感分析,信息检索 数据概述: 该数据集包含了来自新闻网站的头条新闻摘要,记录了新闻标题和对应的简短摘要。主要特征如下: 时间跨度:数据记录的时间范围未知,但涵盖了较长的时间段。... -
论文数据集EssayDataDataset-shenzeyuan
论文数据集EssayDataDataset-shenzeyuan 数据来源:互联网公开数据 标签:教育,学术研究,数据集,文本分析,自然语言处理,机器学习,文本分类,写作评估 数据概述: 该数据集包含来自学术机构和教育平台的论文数据,记录了各类学术论文的文本内容和相关元数据。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
推特多样性推文数据集DiverseTweetsDataset-johnsonubah
推特多样性推文数据集DiverseTweetsDataset-johnsonubah 数据来源:互联网公开数据 标签:推特,社交媒体,数据集,文本分析,自然语言处理,情感分析,多样性,舆情分析 数据概述: 该数据集包含来自推特(Twitter)的公开推文数据,旨在促进对社交媒体上多样性内容的分析和研究。主要特征如下:... -
英语词性标注数据集
英语词性标注数据集 数据来源:互联网公开数据 标签:自然语言处理,词性标注,英语语言,词法分析,文本归一化,Part-Of-Speech,POS标签 数据概述... -
推特文本情感分析数据集TwitterTweetNLPDataset-diwakarsehgal
推特文本情感分析数据集TwitterTweetNLPDataset-diwakarsehgal 数据来源:互联网公开数据 标签:社交媒体,情感分析,自然语言处理,文本挖掘,机器学习,推特,NLP,情绪识别 数据概述: 该数据集包含来自推特(Twitter)的推文数据,用于情感分析和自然语言处理任务。主要特征如下:... -
电影情感分析数据集SentimentAnalysisforFilmsDataset-1-niranjansnambiar
电影情感分析数据集SentimentAnalysisforFilmsDataset-1-niranjansnambiar 数据来源:互联网公开数据 标签:情感分析,电影评论,自然语言处理,数据集,机器学习,文本挖掘,情感识别,数据科学 数据概述: 该数据集包含来自电影评论网站的电影评论数据,记录了用户对电影的情感评价。主要特征如下:... -
palm作文生成评估数据集PalmEssayGenItr1Dataset-amankumartak
palm作文生成评估数据集PalmEssayGenItr1Dataset-amankumartak 数据来源: 互联网公开数据 标签:作文生成,自然语言处理,数据集,机器学习,文本生成,语言模型,教育技术,评估研究 数据概述: 该数据集包含来自Palm作文生成项目(Palm Essay Generation... -
垃圾邮件检测数据集SpamMailDetectionDataset-saksham177
垃圾邮件检测数据集SpamMailDetectionDataset-saksham177 数据来源:互联网公开数据 标签:垃圾邮件,邮件检测,数据集,自然语言处理,文本分类,机器学习,信息安全,风险管理 数据概述: 该数据集包含来自互联网的邮件数据,用于垃圾邮件的检测与分类。主要特征如下: 时间跨度:... -
ABC新闻日期文本数据集ABCNewsDateTextDataset-psnayakitiiests
ABC新闻日期文本数据集ABCNewsDateTextDataset-psnayakitiiests 数据来源:互联网公开数据 标签:新闻文本,数据集,时间序列,文本分析,自然语言处理,媒体研究,机器学习,数据挖掘 数据概述: 该数据集包含来自ABC新闻的文本数据,记录了新闻文章的发布日期和主要内容。主要特征如下:... -
Facebook经济新闻数据集-mochdwifebrianto
Facebook经济新闻数据集-mochdwifebrianto 数据来源:互联网公开数据 标签:经济新闻,社交媒体,数据集,文本分析,自然语言处理,情感分析,金融科技,新闻传播 数据概述: 该数据集包含了来自Facebook平台的经济新闻数据,记录了与经济相关的文章和帖子。主要特征如下: 时间跨度:数据记录的时间范围为不确定,取决于数据集的创建时间。... -
谷歌应用商店评论情感分析数据集SentimentAnalysisGooglePlayDataset-huangkailong
谷歌应用商店评论情感分析数据集SentimentAnalysisGooglePlayDataset-huangkailong 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本挖掘,应用商店,用户评论,大数据 数据概述:... -
愤怒情绪识别数据集AngerDataset-dianaspahieva
愤怒情绪识别数据集AngerDataset-dianaspahieva 数据来源:互联网公开数据 标签:情感分析,数据集,机器学习,情绪识别,心理学,自然语言处理,计算机科学,人工智能 数据概述: 该数据集包含来自公开来源的文本和语音数据,记录了表达愤怒情绪的样本。主要特征如下: 时间跨度:数据记录的时间范围不明确,主要取决于数据来源的时间分布。... -
越南医学问答数据集Kalapa-VietMedQADataset-quangphm
越南医学问答数据集Kalapa-VietMedQADataset-quangphm 数据来源:互联网公开数据 标签:医学问答,数据集,自然语言处理,人工智能,医学信息,越南语,机器学习,健康咨询 数据概述: 该数据集包含来自越南医学领域的问答数据,记录了医学知识问答的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。... -
马拉地语微调数据集MarathiFine-tuningDataDataset-suramyajadhav
马拉地语微调数据集MarathiFine-tuningDataDataset-suramyajadhav 数据来源:互联网公开数据 标签:自然语言处理,文本数据,机器学习,语言模型,数据集,多语言,语言微调,数据训练 数据概述: 该数据集包含马拉地语的文本数据,主要用作自然语言处理任务中的语言模型微调。主要特征如下:...