-
实时推特性别识别数据集RT-GenderDataset-swapnikvarala
实时推特性别识别数据集RT-GenderDataset-swapnikvarala 数据来源:互联网公开数据 标签:社交媒体,性别识别,推特,自然语言处理,机器学习,文本分析,用户画像,情感分析 数据概述: 该数据集包含来自推特平台的推文数据,用于性别识别研究。主要特征如下: 时间跨度:数据记录的时间范围不详,具体时间跨度取决于数据集的构建时间。... -
新冠疫情推文分类机器学习数据集-gauravduttakiit
新冠疫情推文分类机器学习数据集-gauravduttakiit 数据来源:互联网公开数据 标签:新冠疫情,推文,机器学习,情感分析,社交媒体,文本分类,自然语言处理,疫情,Twitter,公共卫生 数据概述:... -
元学习共读理解数据集MetaLearningforCommonLitReadingComprehensionDataset-syndri224
元学习共读理解数据集MetaLearningforCommonLitReadingComprehensionDataset-syndri224 数据来源:互联网公开数据 标签:元学习,阅读理解,数据集,自然语言处理,机器学习,教育研究,语言分析,学术资源... -
垃圾邮件识别数据集SpamDetectionDataset-ripcurl
垃圾邮件识别数据集SpamDetectionDataset-ripcurl 数据来源:互联网公开数据 标签:垃圾邮件,数据集,文本分类,机器学习,自然语言处理,电子邮件,信息安全,数据挖掘 数据概述: 该数据集包含来自电子邮件通信中的大量邮件数据,主要用于垃圾邮件的识别和分类任务。主要特征如下:... -
波斯语语言与文本数据集PersianLanguageandTextDataset-mohsenmirzaei
波斯语语言与文本数据集PersianLanguageandTextDataset-mohsenmirzaei 数据来源:互联网公开数据 标签:语言学,自然语言处理,数据集,文本分析,机器学习,波斯语,文本分类,多语言处理 数据概述: 该数据集包含来自波斯语互联网和公开文本资源的数据,记录了波斯语的语言文本和结构特征。主要特征如下:... -
文本摘要生成数据集SESummarizationDataset-rahulshelke98
文本摘要生成数据集SESummarizationDataset-rahulshelke98 数据来源:互联网公开数据 标签:文本摘要,数据集,自然语言处理,机器学习,信息检索,文本挖掘,语言学,数据科学 数据概述:该数据集包含来自Stack... -
性别中立与包容性文本数据集-pravinkalse
性别中立与包容性文本数据集-pravinkalse 数据来源:互联网公开数据 标签:性别中立,包容性,文本分析,自然语言处理,社会科学,语言模型,数据集,文本生成 数据概述: 该数据集包含来自互联网的文本数据,旨在促进对性别中立和包容性语言的研究与应用。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期和来源的文本。... -
虚假新闻与仇恨言论识别数据集BeritaBohongUjaranKebencianUUITEDataset-pratamaazmi
虚假新闻与仇恨言论识别数据集BeritaBohongUjaranKebencianUUITEDataset-pratamaazmi 数据来源:互联网公开数据 标签:虚假新闻,仇恨言论,数据集,文本分析,机器学习,社会媒体,法律合规,自然语言处理 数据概述: 该数据集包含来自印尼互联网交易所(UU... -
亚马逊用户评价分析数据集UOEProjectAmazonDataset-yesornope
亚马逊用户评价分析数据集UOEProjectAmazonDataset-yesornope 数据来源:互联网公开数据 标签:电商,用户评价,数据集,自然语言处理,情感分析,机器学习,零售业,数据挖掘 数据概述: 该数据集来自亚马逊用户评价项目(UOE Project),记录了亚马逊平台上用户对商品的评价数据。主要特征如下:... -
推特情绪分析数据集TwitterSentimentAnalysisDataset-terfyworld
推特情绪分析数据集TwitterSentimentAnalysisDataset-terfyworld 数据来源:互联网公开数据 标签:推特,情绪分析,情感分析,自然语言处理,社交媒体,文本挖掘,机器学习,舆情分析 数据概述: 该数据集包含了来自推特平台的大量推文数据,用于情绪分析和情感分析任务。主要特征如下: 时间跨度:... -
电影情节摘要数据集MoviesPlotSummaryDataset-aadarsh168
电影情节摘要数据集MoviesPlotSummaryDataset-aadarsh168 数据来源:互联网公开数据 标签:电影,情节,摘要,文本分析,自然语言处理,情感分析,剧情,影视 数据概述: 该数据集包含了电影情节的摘要信息,旨在为文本分析,自然语言处理等研究提供数据支持。主要特征如下:... -
法律文本分类测试数据集LegalBERTInferTestSet-minh29
法律文本分类测试数据集LegalBERTInferTestSet-minh29 数据来源:互联网公开数据 标签:法律文本,文本分类,数据集,自然语言处理,机器学习,法律研究,人工智能,深度学习 数据概述: 该数据集包含用于法律文本分类的测试数据,记录了各类法律文书的文本内容及其分类标签。主要特征如下:... -
莎士比亚作品中单词出现频率数据集-emmabel
莎士比亚作品中单词出现频率数据集-emmabel 数据来源:互联网公开数据 标签:莎士比亚,文学,单词频率,自然语言处理,文本分析,教育,文化 数据概述:... -
西班牙经济学家报经济新闻情感分析数据集-abrahammontoya
西班牙经济学家报经济新闻情感分析数据集-abrahammontoya 数据来源:互联网公开数据 标签:经济新闻,西班牙,情感分析,文本数据,新闻数据,网络爬取,自然语言处理,财经,新闻 数据概述: 本数据集包含了西班牙报纸《经济学家报》(El Economista)经济版块的新闻数据。 数据集涵盖了新闻的标题、作者、正文内容、发布日期和新闻URL。... -
Reber文法序列生成与分析数据集-harshildarji
Reber文法序列生成与分析数据集-harshildarji 数据来源:互联网公开数据 标签:Reber文法,序列生成,LSTM,时间序列,文本数据,机器学习,自然语言处理,数据可视化 数据概述:... -
Jigsaw多语言有毒评论分类数据集-评论翻译与情感分析增强版
Jigsaw多语言有毒评论分类数据集-评论翻译与情感分析增强版 数据来源:互联网公开数据 标签:文本分类,自然语言处理,情感分析,多语言,有毒评论,评论数据,机器翻译,英语,机器学习 数据概述:... -
表格摘要数据集2020年6月16日SummaryTablesDataset-June16-2020-crispyc
表格摘要数据集2020年6月16日SummaryTablesDataset-June16-2020-crispyc 数据来源:互联网公开数据 标签:表格摘要,数据集,自然语言处理,文本挖掘,机器学习,信息提取,知识图谱,人工智能 数据概述: 该数据集包含来自多个来源的表格数据及其对应的文本摘要,记录了表格内容的自动生成文本描述。主要特征如下:... -
大规模语言模型开源项目LMSYS的快速版LLaMA数据集LMSYSOpen-sourceFastLLaMADataset-rushali98
大规模语言模型开源项目LMSYS的快速版LLaMA数据集LMSYSOpen-sourceFastLLaMADataset-rushali98 数据来源:互联网公开数据 标签:自然语言处理,大型语言模型,数据集,LLaMA,开源,文本生成,机器学习,预训练 数据概述:... -
机器黑客UHack情感分析数据集MachineHackUHackSentimentAnalysisDataset-jarupula
机器黑客UHack情感分析数据集MachineHackUHackSentimentAnalysisDataset-jarupula 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本分析,数据挖掘,人工智能,情感计算 数据概述: 该数据集由机器黑客UHack竞赛提供,专注于文本情感分析任务。主要特征如下:... -
网络欺凌评论数据集CyberbullyingCommentsDataset-jayaprakashpondy
网络欺凌评论数据集CyberbullyingCommentsDataset-jayaprakashpondy 数据来源:互联网公开数据 标签:网络欺凌,社交媒体,数据集,情感分析,自然语言处理,文本分类,机器学习,心理学研究...