-
Reddit恐怖故事数据集SpookyRedditStoriesDataset-justjoshtings
Reddit恐怖故事数据集SpookyRedditStoriesDataset-justjoshtings 数据来源:互联网公开数据 标签:恐怖故事,数据集,文本分析,情感分析,自然语言处理,社交媒体,机器学习,内容创作 数据概述: 该数据集包含来自Reddit平台上的恐怖故事数据,记录了用户发布的各类恐怖故事内容。主要特征如下:... -
多语言字幕数据集Opensubtitles6LanguagesforJigsaw2020-ratthachat
多语言字幕数据集Opensubtitles6LanguagesforJigsaw2020-ratthachat 数据来源:互联网公开数据 标签:自然语言处理,多语言文本,字幕数据,机器学习,文本分类,情感分析,数据集,人工智能 数据概述:... -
垃圾信息过滤与Quora问题分类数据集SpamFilterforQuoraQuestionsDataset-vijayadithyabk
垃圾信息过滤与Quora问题分类数据集SpamFilterforQuoraQuestionsDataset-vijayadithyabk 数据来源:互联网公开数据 标签:垃圾信息过滤,Quora问答,文本分类,自然语言处理,机器学习,数据挖掘,信息检索,网络安全 数据概述:... -
图像描述生成数据集ImageCaptionsDataset-sandhyas29
图像描述生成数据集ImageCaptionsDataset-sandhyas29 数据来源:互联网公开数据 标签:图像描述,数据集,计算机视觉,自然语言处理,深度学习,图像识别,文本生成,人工智能 数据概述: 该数据集包含图像及其对应的文字描述,旨在用于训练图像描述生成模型。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了不同时期和场景的图像。... -
基于BERT的电影评论情感分析数据集DF-CleanedBERT-MovieReviewSentimentAnalysisDataset-trngththanhh
基于BERT的电影评论情感分析数据集DF-CleanedBERT-MovieReviewSentimentAnalysisDataset-trngththanhh 数据来源:互联网公开数据 标签:情感分析,自然语言处理,电影评论,BERT,数据集,文本分类,机器学习,情感挖掘 数据概述:... -
加州大学圣迭戈分校UCSDReddit子版块数据集-luketaylor12345
加州大学圣迭戈分校UCSDReddit子版块数据集-luketaylor12345 数据来源:互联网公开数据 标签:社交媒体,Reddit,数据集,文本分析,自然语言处理,情感分析,社区研究,机器学习 数据概述: 该数据集包含了来自加州大学圣迭戈分校(UCSD)相关的 Reddit 子版块的数据,记录了用户在 Reddit... -
社交媒体用户情绪分析数据集SocialMediaUserSentimentAnalysis-shivang7514
社交媒体用户情绪分析数据集SocialMediaUserSentimentAnalysis-shivang7514 数据来源:互联网公开数据 标签:情绪分析, 社交媒体, 文本情感, 自然语言处理, 情感分类, 舆情分析, 数据挖掘, 机器学习 数据概述:... -
搜索引擎查询数据集20k-QueriesPreprocessedSegmentedData-ictworld
搜索引擎查询数据集20k-QueriesPreprocessedSegmentedData-ictworld 数据来源:互联网公开数据 标签:搜索引擎,查询分析,数据集,自然语言处理,文本挖掘,信息检索,用户行为,数据科学 数据概述: 该数据集包含来自搜索引擎的预处理和分词后的查询数据,记录了用户输入的搜索查询信息。主要特征如下:... -
豆瓣电影评论数据集-ynanyue
豆瓣电影评论数据集-ynanyue 数据来源:互联网公开数据 标签:电影,评论,情感分析,自然语言处理,数据集,文本挖掘,用户行为,推荐系统 数据概述: 该数据集包含来自豆瓣电影网站的电影评论数据,记录了用户对电影的评价、观影体验以及相关信息。主要特征如下: 时间跨度:数据记录的时间范围不定,取决于数据抓取的时间窗口。... -
数学问题解答数据集MathematicsProblemAnsweringDataset-saadtahmid
数学问题解答数据集MathematicsProblemAnsweringDataset-saadtahmid 数据来源:互联网公开数据 标签:数学, 问题解答, 自然语言处理, 文本生成, 数学教育, 问答系统, 机器学习, 数据集 数据概述: 该数据集包含来自互联网的数学问题及其对应的解答,旨在用于训练和评估数学问题解答模型。主要特征如下:... -
越南新闻数据集VietNews数据集-trananhcuong
越南新闻数据集VietNews数据集-trananhcuong 数据来源:互联网公开数据 标签:越南新闻, 数据集, 自然语言处理, 机器学习, 文本分析, 新闻学, 文本挖掘, 社会研究... -
手写文本图像识别及内容标注数据集HandwrittenTextImageRecognitionandContentAnnotationDataset-yiyueme
手写文本图像识别及内容标注数据集HandwrittenTextImageRecognitionandContentAnnotationDataset-yiyueme 数据来源:互联网公开数据 标签:手写文本识别, 图像识别, OCR, 自然语言处理, 文本标注, 图像分类, 深度学习, 法语 数据概述:... -
越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-tienbk
越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-tienbk 数据来源:互联网公开数据 标签:文本纠错, 越南语, 自然语言处理, 深度学习, 错误检测, 语料库, 文本校对, 机器学习 数据概述: 该数据集包含越南语文本,记录了原始句子及其对应的带有错误的版本,用于越南语文本纠错任务。主要特征如下:... -
语音样本数据集SpeechSampleDataset-ramya19051992
语音样本数据集SpeechSampleDataset-ramya19051992 数据来源:互联网公开数据 标签:语音识别,数据集,音频处理,机器学习,自然语言处理,人工智能,信号处理,教育技术 数据概述: 该数据集包含来自不同来源的语音样本数据,记录了多种语音信号的特征。主要特征如下: 时间跨度:数据记录的时间范围不固定,涵盖多个时间段。... -
恶意信息文本分类数据集-aniketgupta01
恶意信息文本分类数据集-aniketgupta01 数据来源:互联网公开数据 标签:文本分类,自然语言处理,机器学习,恶意信息,情感分析,数据集,NLP,深度学习 数据概述: 该数据集包含用于恶意信息文本分类的文本数据,旨在识别和区分文本中的恶意内容。主要特征如下: 时间跨度:数据记录的时间跨度不明确,但包含了当前常见的网络用语和恶意表达方式。... -
说服性论文数据集PersuadeEssayDataset-gendoso
说服性论文数据集PersuadeEssayDataset-gendoso 数据来源:互联网公开数据 标签:论文,数据集,自然语言处理,文本分析,写作质量,情感分析,机器学习,教育 数据概述: 该数据集包含来自 Kaggle 的说服性论文数据,记录了学生撰写的说服性文章,旨在评估学生的写作能力及说服技巧。主要特征如下:... -
能源公司电子邮件数据集EnronEmailDataset-tanweishing
能源公司电子邮件数据集EnronEmailDataset-tanweishing 数据来源:互联网公开数据 标签:电子邮件数据,数据集,企业通信,数据分析,机器学习,文本挖掘,自然语言处理,商业智能 数据概述: 该数据集包含来自恩隆公司(Enron... -
Python编程问答数据集PythonQADatasets-terrychanorg
Python编程问答数据集PythonQADatasets-terrychanorg 数据来源:互联网公开数据 标签:编程,问答,数据集,自然语言处理,机器学习,算法,教育,技术支持 数据概述: 该数据集包含来自公开编程问答平台的数据,记录了关于Python编程的常见问题和解答。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。... -
新闻报纸普里特里卡数据集NewspaperPotrikaDataset-miratunnahar
新闻报纸普里特里卡数据集NewspaperPotrikaDataset-miratunnahar 数据来源:互联网公开数据 标签:新闻,数据集,文本分析,社会研究,机器学习,自然语言处理,学术资源,历史研究 数据概述:该数据集包含来自普里特里卡(Potrika)报纸的数据,记录了该报纸从1870年到2018年期间的历史文章。主要特征如下:... -
亚马逊商品元数据数据集AmazonMeta-DataDataset-dartigb
亚马逊商品元数据数据集AmazonMeta-DataDataset-dartigb 数据来源:互联网公开数据 标签:电商,商品,元数据,文本分析,推荐系统,自然语言处理,机器学习,数据挖掘 数据概述: 该数据集包含来自亚马逊电商平台的商品元数据,记录了大量商品的详细信息。主要特征如下:...