-
CommonLit阅读理解数据集CommonLitCrawledDataDataset-safavieh
CommonLit阅读理解数据集CommonLitCrawledDataDataset-safavieh 数据来源:互联网公开数据 标签:阅读理解,数据集,自然语言处理,机器学习,教育研究,文本分析,人工智能,语言学习 数据概述:该数据集包含来自CommonLit项目的数据,记录了大量阅读理解相关的文章和对应的问题。主要特征如下:... -
生成式山脉实体识别数据集GeneratedMountainEntityRecognitionDataset-artemzysko
生成式山脉实体识别数据集GeneratedMountainEntityRecognitionDataset-artemzysko 数据来源:互联网公开数据 标签:自然语言处理,实体识别,数据集,机器学习,文本分析,地理信息,人工智能,语义理解 数据概述: 该数据集包含通过生成式模型创建的文本数据,专注于山脉相关实体的识别任务。主要特征如下:... -
专利摘要分析数据集PatentsAbstractsDataset-chizzi25
专利摘要分析数据集PatentsAbstractsDataset-chizzi25 数据来源:互联网公开数据 标签:专利,摘要,文本分析,自然语言处理,机器学习,专利检索,知识产权,技术创新 数据概述: 该数据集包含来自公开专利文献的摘要信息,记录了不同领域的专利技术描述。主要特征如下:... -
虚假新闻检测数据集ProcessedFakeNewsDataset-negikirin
虚假新闻检测数据集ProcessedFakeNewsDataset-negikirin 数据来源:互联网公开数据 标签:虚假新闻,假新闻检测,文本分析,自然语言处理,机器学习,新闻分类,信息真实性,数据挖掘 数据概述: 该数据集包含经过处理的虚假新闻数据,旨在用于虚假新闻的检测和分类。主要特征如下:... -
伊斯兰书籍文本数据集1000IslamicBooksDataset-huzaifatahir7524
伊斯兰书籍文本数据集1000IslamicBooksDataset-huzaifatahir7524 数据来源:互联网公开数据 标签:伊斯兰教,书籍,文本分析,宗教研究,自然语言处理,数据集,文化,文献 数据概述: 该数据集包含来自互联网的1000本伊斯兰书籍的文本数据,涵盖了伊斯兰教的各个方面。主要特征如下:... -
金属乐队歌曲歌词数据集MetallicaSongswithLyricsDataset-dmytroievdokymov
金属乐队歌曲歌词数据集MetallicaSongswithLyricsDataset-dmytroievdokymov 数据来源:互联网公开数据 标签:音乐,歌词,金属乐队,摇滚,数据集,文本分析,音乐研究,情感分析 数据概述: 该数据集包含金属乐队(Metallica)的歌曲歌词数据,记录了乐队自成立以来的歌曲的歌词内容。主要特征如下:... -
数据2024年Reddit帖子数据集-vooono
2024年Reddit帖子数据集-vooono 数据来源:互联网公开数据 标签:社交媒体,Reddit,帖子,文本分析,情感分析,自然语言处理,数据挖掘,用户行为 数据概述: 该数据集包含来自Reddit平台的帖子数据,记录了用户在不同版块发布的文本内容及相关信息。主要特征如下: 时间跨度:数据记录的时间范围为2024年。... -
反垃圾邮件预处理数据集BalancedSpamPreprocessedDataset-zeyadkhalid
反垃圾邮件预处理数据集BalancedSpamPreprocessedDataset-zeyadkhalid 数据来源:互联网公开数据 标签:垃圾邮件,数据集,文本分析,自然语言处理,机器学习,分类算法,数据预处理,文本挖掘 数据概述: 该数据集包含经过预处理的反垃圾邮件数据,用于垃圾邮件检测和分类任务。主要特征如下: 时间跨度:... -
土耳其科技新闻数据集TurkishTechnologyNewsDataset-denizhanahin
土耳其科技新闻数据集TurkishTechnologyNewsDataset-denizhanahin 数据来源:互联网公开数据 标签:土耳其,科技新闻,自然语言处理,文本分析,新闻摘要,情感分析,机器学习,土耳其语 数据概述: 该数据集包含来自土耳其新闻网站的科技新闻文章,记录了土耳其科技领域的新闻报道。主要特征如下:... -
维基百科平衡性别共指数据集-thedevastator
维基百科平衡性别共指数据集-thedevastator 数据来源:互联网公开数据 标签:共指,性别平衡,数据集,维基百科,文本分析,自然语言处理,NLP,教育,研究 数据概述:... -
自然语言处理项目原始数据集-emilygreen8
自然语言处理项目原始数据集-emilygreen8 数据来源:互联网公开数据 标签:自然语言处理,NLP,数据集,文本数据,语料库,数据预处理,机器学习,文本分析 数据概述: 该数据集包含用于自然语言处理(NLP)项目的原始文本数据,涵盖多种文本来源和语言。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于各个子数据集的发布时间。... -
古兰经印尼语版本数据集QuranIndonesiaDataset-sofyanuli
古兰经印尼语版本数据集QuranIndonesiaDataset-sofyanuli 数据来源:互联网公开数据 标签:古兰经,宗教,伊斯兰教,文本分析,自然语言处理,文化研究,宗教文本,印尼语 数据概述: 该数据集包含古兰经的印尼语版本,记录了《古兰经》中的所有章节(苏拉)和经文(阿亚特)。主要特征如下:... -
刑事审判案例数据集TRECTrialDataExampleDataset-cryosky
刑事审判案例数据集TRECTrialDataExampleDataset-cryosky 数据来源:互联网公开数据 标签:法律研究,司法数据,数据集,案例分析,机器学习,文本分析,法律科技,司法统计 数据概述: 该数据集包含来自刑事审判案例的文本数据,记录了案件的基本信息,审判过程和法律判决。主要特征如下:... -
学术论文引用关系数据集SIYAPaperDataset-lakshinpathak
学术论文引用关系数据集SIYAPaperDataset-lakshinpathak 数据来源:互联网公开数据 标签:学术论文,引用关系,数据集,知识图谱,自然语言处理,文本分析,学术研究,科学计量学 数据概述:该数据集包含来自多个学术领域的论文引用关系数据,记录了论文之间的引用情况,适用于学术研究,知识图谱构建等任务。主要特征如下:... -
圣经文本数据集-vishnuprksh
圣经文本数据集-vishnuprksh 数据来源:互联网公开数据 标签:圣经,文本分析,自然语言处理,数据集,宗教研究,语言学,文本挖掘,语料库 数据概述:该数据集包含来自圣经的文本数据,涵盖了旧约和新约的多个版本和翻译。主要特征如下: 时间跨度:数据记录的时间跨度涵盖了圣经创作的整个时期,从公元前15世纪到公元1世纪。... -
电影描述数据集MovieDescriptionDataset-malihamehjabinmitu
电影描述数据集MovieDescriptionDataset-malihamehjabinmitu 数据来源:互联网公开数据 标签:电影,数据集,文本分析,自然语言处理,情感分析,机器学习,影视研究,数据挖掘 数据概述: 该数据集包含来自公开电影数据库的电影描述数据,记录了多部电影的剧情简介,分类标签,导演,演员等信息。主要特征如下:... -
Flipkart产品属性值提取数据集FlipkartProductsforAttribute-ValueExtractionDataset-lameesm...
Flipkart产品属性值提取数据集FlipkartProductsforAttribute-ValueExtractionDataset-lameesmohamedmohee 数据来源:互联网公开数据 标签:电子商务,产品数据,属性提取,数据集,自然语言处理,机器学习,文本分析,数据挖掘 数据概述:... -
现代BERT模型微调数据集Fine-tuneModernBERTDataset-nlgluong
现代BERT模型微调数据集Fine-tuneModernBERTDataset-nlgluong 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,BERT,模型微调,情感分析,文本分类 数据概述: 该数据集包含用于微调现代BERT模型的数据,主要记录了用于各种自然语言处理任务的文本信息。主要特征如下:... -
古兰经印尼语翻译数据集DataAl-QuranIndonesia-wahyunahdaputra
古兰经印尼语翻译数据集DataAl-QuranIndonesia-wahyunahdaputra 数据来源:互联网公开数据 标签:古兰经,印尼语,翻译,宗教,文本分析,自然语言处理,伊斯兰教,数据集 数据概述: 该数据集包含来自印尼语翻译的古兰经文本,记录了古兰经经文的印尼语翻译内容。主要特征如下:... -
生成式AI文章数据集ChatGPTFakeArticlesDataset-michaeljs
生成式AI文章数据集ChatGPTFakeArticlesDataset-michaeljs 数据来源:互联网公开数据 标签:生成式AI,假新闻,数据集,文本分析,自然语言处理,机器学习,信息验证,网络安全 数据概述:该数据集包含由ChatGPT生成的假新闻文章,记录了AI生成的文章内容及特征。主要特征如下:...