-
书籍评论与推荐数据集BooksReviewsandRecommendationsDataset-annnguyen123
书籍评论与推荐数据集BooksReviewsandRecommendationsDataset-annnguyen123 数据来源:互联网公开数据 标签:书籍,评论,推荐系统,自然语言处理,文本分析,用户行为,机器学习,数据挖掘 数据概述:... -
安卓应用商店用户评论数据集AndroidPlaystoreReviewDataset-divanshu22
安卓应用商店用户评论数据集AndroidPlaystoreReviewDataset-divanshu22 数据来源:互联网公开数据 标签:用户评论,应用商店,数据集,文本分析,情感分析,机器学习,自然语言处理,用户体验 数据概述: 该数据集包含来自安卓应用商店的用户评论数据,记录了用户对各类应用的反馈和评价。主要特征如下:... -
文学作品按体裁分类数据集-mehedihasan9021
文学作品按体裁分类数据集-mehedihasan9021 数据来源:互联网公开数据 标签:文学,数据集,文本分析,自然语言处理,情感分析,分类,语料库,文本挖掘 数据概述: 该数据集包含按体裁分类的文学作品数据,旨在为文本分析和自然语言处理研究提供丰富的语料。主要特征如下: 时间跨度:数据涵盖不同时期和时代的文学作品。... -
科技创业新闻数据库TechCrunchNewsDatabase-crawlfeeds
科技创业新闻数据库TechCrunchNewsDatabase-crawlfeeds 数据来源:互联网公开数据 标签:科技新闻,创业公司,数据集,文本分析,机器学习,行业研究,新闻聚合,商业智能 数据概述: 该数据集包含来自科技博客TechCrunch的新闻文章数据,记录了科技创业领域的新闻动态和行业信息。主要特征如下:... -
基于自然语言处理的邮件钓鱼欺诈检测数据集-muhammedtariq99
基于自然语言处理的邮件钓鱼欺诈检测数据集-muhammedtariq99 数据来源:互联网公开数据 标签:钓鱼欺诈检测,自然语言处理,NLP,邮件安全,机器学习,文本分析,欺诈识别,安全防护 数据概述:... -
印地语维基百科数据集HindiWikipediaDataset-vjdwary
印地语维基百科数据集HindiWikipediaDataset-vjdwary 数据来源:互联网公开数据 标签:维基百科,印地语,数据集,自然语言处理,文本分析,机器学习,语言资源,多语言处理 数据概述: 该数据集包含来自印地语维基百科的文本数据,记录了维基百科上的文章内容。主要特征如下:... -
德国联邦议院议员演讲文本翻译与摘要数据集-2021-2022-kevinbnisch
德国联邦议院议员演讲文本翻译与摘要数据集-2021-2022-kevinbnisch 数据来源:互联网公开数据 标签:德国联邦议院,演讲,文本分析,翻译,摘要,政治,NLP,自然语言处理,机器翻译,BART模型 数据概述: 本数据集包含1万篇德国联邦议院议员的演讲文本,这些演讲文本均来源于德国联邦议院官方网站。数据经过网络抓取,并使用OPUS-... -
阿塞拜疆语新闻评论数据集BİLDİRAZReviewsDataset-vrashad
阿塞拜疆语新闻评论数据集BİLDİRAZReviewsDataset-vrashad 数据来源:互联网公开数据 标签:新闻评论,数据集,文本分析,情感分析,自然语言处理,机器学习,阿塞拜疆语,语言技术 数据概述: 该数据集包含来自阿塞拜疆新闻网站BİLDİR AZ的用户评论数据,记录了用户对新闻内容的反馈和观点。主要特征如下:... -
英语到孟加拉语翻译数据集EnglishtoBengaliTranslationDataset-ritankardas
英语到孟加拉语翻译数据集EnglishtoBengaliTranslationDataset-ritankardas 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,机器学习,语言模型,文本分析,多语言,人工智能 数据概述: 该数据集包含英语到孟加拉语的平行语料,记录了双语翻译的对应句子。主要特征如下:... -
新冠疫情Twitter推文数据集COVID-19TweetsDataset-ankanderia
新冠疫情Twitter推文数据集COVID-19TweetsDataset-ankanderia 数据来源:互联网公开数据 标签:新冠疫情,推文数据,社交媒体,自然语言处理,情感分析,疫情研究,数据挖掘,文本分析 数据概述: 该数据集包含来自Twitter的关于新冠疫情的推文数据,记录了全球范围内用户在社交媒体上对疫情的讨论和观点。主要特征如下:... -
古兰经文本与地点数据集2023数据集-abdulbaqi
古兰经文本与地点数据集2023数据集-abdulbaqi 数据来源:互联网公开数据 标签:古兰经,文本分析,宗教研究,数据集,伊斯兰教,文化研究,文本挖掘,语言学 数据概述:该数据集包含来自公开来源的古兰经文本数据,记录了古兰经章节及其对应内容,并标注了其在伊斯兰教历史和文化中的重要地点。主要特征如下:... -
垃圾邮件与非垃圾邮件分类数据集Spam-HamData-liaichimustapha
垃圾邮件与非垃圾邮件分类数据集Spam-HamData-liaichimustapha 数据来源:互联网公开数据 标签:邮件分类,垃圾邮件,数据集,文本分析,机器学习,自然语言处理,分类算法,网络安全 数据概述: 该数据集包含来自公开邮件收集项目的数据,记录了电子邮件的分类信息,主要分为垃圾邮件(spam)和非垃圾邮件(ham)。主要特征如下:... -
网络钓鱼邮件类型识别数据集-160封邮件-charlottehall
网络钓鱼邮件类型识别数据集-160封邮件-charlottehall 数据来源:互联网公开数据 标签:网络钓鱼,电子邮件,类型识别,网络安全,数据集,文本分析,反垃圾邮件,电子邮件分类 数据概述:... -
Medium文章阅读时长预测数据集-vineeth1999
Medium文章阅读时长预测数据集-vineeth1999 数据来源:互联网公开数据 标签:文本分析,阅读时长预测,数据集,自然语言处理,机器学习,用户行为分析,内容推荐,数据挖掘 数据概述: 该数据集包含了来自Medium平台的文章数据和用户阅读时长信息,用于预测文章的阅读时长。主要特征如下:... -
自然语言处理数据集NLP数据集-mkmanoj353
自然语言处理数据集NLP数据集-mkmanoj353 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,人工智能,语言模型,文本分类,情感分析 数据概述:该数据集包含来自多个来源的自然语言处理数据,记录了大量文本数据以支持各种NLP任务。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。... -
文本分析工具数据集TextAnalysisToolDataset-jaynadkarni
文本分析工具数据集TextAnalysisToolDataset-jaynadkarni 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,机器学习,情感分析,文本挖掘,语言模型,数据科学 数据概述: 该数据集包含来自多个公开来源的文本数据,记录了各类文本内容的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年至今。... -
推特灾难事件数据集DisasterTwitterData-riturajsingh99
推特灾难事件数据集DisasterTwitterData-riturajsingh99 数据来源:互联网公开数据 标签:推特,灾难事件,自然语言处理,文本分析,机器学习,社交媒体,舆情分析,危机管理 数据概述: 该数据集包含来自推特(Twitter)的公开数据,记录了与灾难事件相关的内容。主要特征如下:... -
印度地址相似度分析数据集-karan510
印度地址相似度分析数据集-karan510 数据来源:互联网公开数据 标签:地址数据,印度,数据清洗,地理信息,机器学习,文本分析,相似度计算,自然语言处理 数据概述:该数据集包含了来自印度地区的地址数据,主要用于地址相似度分析和数据清洗。主要特征如下: 时间跨度:数据记录时间跨度不限,主要为历史地址数据。... -
CommonLit阅读理解文本特征数据集-douglaskgaraujo
CommonLit阅读理解文本特征数据集-douglaskgaraujo 数据来源:互联网公开数据 标签:文本特征,阅读理解,可读性,自然语言处理,教育,CommonLit,文本分析,机器学习 数据概述: 本数据集是对CommonLit阅读理解挑战赛提供的文本数据进行特征计算的结果。... -
推特灾害检测数据集TwitterDisasterDetectionDataset-sankaraassane
推特灾害检测数据集TwitterDisasterDetectionDataset-sankaraassane 数据来源:互联网公开数据 标签:社交媒体,灾害检测,数据集,文本分析,机器学习,自然语言处理,信息挖掘,应急响应 数据概述: 该数据集包含来自推特平台的数据,记录了用户发布的与灾害相关的推文内容。主要特征如下:...