-
英语学习文本数据集en-train-csv-elguapo
英语学习文本数据集en-train-csv-elguapo 数据来源:互联网公开数据 标签:英语学习,文本数据,自然语言处理,语言模型,数据集,语料库,机器学习,文本分析 数据概述: 该数据集包含了用于英语学习的文本数据,记录了大量的英语句子,段落及文章。主要特征如下: 时间跨度: 数据记录的时间范围不固定,涵盖了不同时期的英语文本。 地理范围:... -
瑞克与莫蒂剧本数据集RickandMortyScriptDataset-isabelgonalves
瑞克与莫蒂剧本数据集RickandMortyScriptDataset-isabelgonalves 数据来源:互联网公开数据 标签:瑞克与莫蒂,剧本,数据集,动画,喜剧,文本分析,自然语言处理,剧本分析 数据概述: 该数据集包含了瑞克与莫蒂(Rick and Morty)动画剧集的所有剧本数据,记录了每一集中的对话,场景描述等信息。主要特征如下:... -
JIRA问题追踪数据集JIRAPublicDataset-cesaranasco
JIRA问题追踪数据集JIRAPublicDataset-cesaranasco 数据来源:互联网公开数据 标签:软件工程,问题追踪,数据集,缺陷管理,项目管理,文本分析,自然语言处理,机器学习 数据概述: 该数据集包含来自JIRA的公开问题追踪数据,记录了软件开发项目中的问题,缺陷,任务等信息。主要特征如下:... -
社交媒体平台虚假新闻检测数据集
社交媒体平台虚假新闻检测数据集 数据来源:互联网公开数据 标签:虚假新闻,假新闻,新闻检测,社交媒体,Politifact,Gossipcop,文本分析,自然语言处理 数据概述:... -
古汉语分类数据集ClassicalChineseClassifyDataset-waautomat
古汉语分类数据集ClassicalChineseClassifyDataset-waautomat 数据来源:互联网公开数据 标签:古汉语,文本分类,数据集,自然语言处理,机器学习,语言学,文化遗产,文本分析 数据概述: 该数据集包含来自各种古汉语文献的文本数据,记录了不同时期和类型的古汉语文本。主要特征如下:... -
尼泊尔语句子压缩数据集SentenceCompressionNepaliDataset-sbastola73
尼泊尔语句子压缩数据集SentenceCompressionNepaliDataset-sbastola73 数据来源:互联网公开数据 标签:自然语言处理,文本压缩,数据集,机器学习,语言技术,尼泊尔语,文本分析,语音识别 数据概述: 该数据集包含来自尼泊尔语文本的句子压缩数据,记录了尼泊尔语句子的原始内容和压缩后的版本。主要特征如下:... -
圣经情感分析数据集BibliaSentimentDataset-paulogladson
圣经情感分析数据集BibliaSentimentDataset-paulogladson 数据来源:互联网公开数据 标签:情感分析,文本挖掘,数据集,自然语言处理,圣经研究,机器学习,情感分类,文本分析 数据概述: 该数据集包含来自圣经文本的情感分析数据,记录了圣经中不同篇章的情感倾向。主要特征如下:... -
命名实体识别标注语料库数据集-endofnight17j03
命名实体识别标注语料库数据集-endofnight17j03 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,文本分析,机器学习,语料库,信息抽取,标注数据 数据概述:该数据集包含用于命名实体识别(NER)任务的标注语料,记录了文本中各种命名实体的详细信息。主要特征如下:... -
小红书笔记数据集XiaohongshuBlogsDataset-huzujun
小红书笔记数据集XiaohongshuBlogsDataset-huzujun 数据来源:互联网公开数据 标签:社交媒体,数据集,用户行为,文本分析,情感分析,消费趋势,商业智能,市场营销 数据概述:该数据集包含来自小红书平台的用户笔记数据,记录了用户发布的内容,互动及标签等信息。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。... -
电影剧情数据集MovieswithPlotDataset-tankhanhdao
电影剧情数据集MovieswithPlotDataset-tankhanhdao 数据来源:互联网公开数据 标签:电影,剧情,数据集,文本分析,自然语言处理,电影研究,文化研究,娱乐产业 数据概述:该数据集包含来自多个来源的电影详细信息,特别是电影的剧情摘要。主要特征如下: 时间跨度:数据记录的时间范围从电影产业的早期阶段到现代。... -
创意写作文本清洗数据集-mohamednafea01
创意写作文本清洗数据集-mohamednafea01 数据来源:互联网公开数据 标签:文本数据,创意写作,数据清洗,自然语言处理,文本分析,语料库,机器学习,NLP 数据概述: 该数据集包含经过清洗的创意写作文本,旨在为自然语言处理和文本分析任务提供高质量的语料库。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期和类型的创意写作文本。... -
音乐歌词迷你数据集-italomarcelo
音乐歌词迷你数据集-italomarcelo 数据来源:互联网公开数据 标签:音乐,歌词,数据集,自然语言处理,文本分析,情感分析,机器学习,音乐流派 数据概述: 该数据集包含精选的音乐歌词数据,旨在用于音乐和语言相关的研究和分析。主要特征如下: 时间跨度:数据覆盖了多个年代的音乐作品,没有明确的时间范围。... -
语音安全保护文本数据集VoiceShieldTextData-tigistwondimneh
语音安全保护文本数据集VoiceShieldTextData-tigistwondimneh 数据来源:互联网公开数据 标签:语音识别,数据安全,数据集,自然语言处理,隐私保护,机器学习,信息安全,文本分析 数据概述: 该数据集包含来自语音安全保护项目(VoiceShield)的文本数据,记录了用户语音交互过程中涉及的敏感信息和保护措施。主要特征如下:... -
泰米尔语仇恨言论数据集TamilHateSpeechDataset-karnatiprash
泰米尔语仇恨言论数据集TamilHateSpeechDataset-karnatiprash 数据来源:互联网公开数据 标签:仇恨言论,自然语言处理,文本分析,机器学习,情感分析,泰米尔语,社交媒体,语言学 数据概述: 该数据集包含了来自社交媒体平台的泰米尔语文本数据,主要用于仇恨言论的检测与分析。主要特征如下:... -
新闻头条摘要数据集MinorNewsHeadlinesDataset-adya07
新闻头条摘要数据集MinorNewsHeadlinesDataset-adya07 数据来源:互联网公开数据 标签:新闻,头条,文本分析,自然语言处理,数据集,摘要,情感分析,信息检索 数据概述: 该数据集包含了来自新闻网站的头条新闻摘要,记录了新闻标题和对应的简短摘要。主要特征如下: 时间跨度:数据记录的时间范围未知,但涵盖了较长的时间段。... -
论文数据集EssayDataDataset-shenzeyuan
论文数据集EssayDataDataset-shenzeyuan 数据来源:互联网公开数据 标签:教育,学术研究,数据集,文本分析,自然语言处理,机器学习,文本分类,写作评估 数据概述: 该数据集包含来自学术机构和教育平台的论文数据,记录了各类学术论文的文本内容和相关元数据。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
推特多样性推文数据集DiverseTweetsDataset-johnsonubah
推特多样性推文数据集DiverseTweetsDataset-johnsonubah 数据来源:互联网公开数据 标签:推特,社交媒体,数据集,文本分析,自然语言处理,情感分析,多样性,舆情分析 数据概述: 该数据集包含来自推特(Twitter)的公开推文数据,旨在促进对社交媒体上多样性内容的分析和研究。主要特征如下:... -
亚马逊图书分类数据集AmazonBooksCategory-wiseDataset-ashishjhuria
亚马逊图书分类数据集AmazonBooksCategory-wiseDataset-ashishjhuria 数据来源:互联网公开数据 标签:图书分类,电子商务,数据集,文本分析,机器学习,零售业,商业智能,数据挖掘 数据概述: 该数据集包含来自亚马逊网站的图书数据,记录了图书的详细分类信息。主要特征如下:... -
ABC新闻日期文本数据集ABCNewsDateTextDataset-psnayakitiiests
ABC新闻日期文本数据集ABCNewsDateTextDataset-psnayakitiiests 数据来源:互联网公开数据 标签:新闻文本,数据集,时间序列,文本分析,自然语言处理,媒体研究,机器学习,数据挖掘 数据概述: 该数据集包含来自ABC新闻的文本数据,记录了新闻文章的发布日期和主要内容。主要特征如下:... -
Facebook经济新闻数据集-mochdwifebrianto
Facebook经济新闻数据集-mochdwifebrianto 数据来源:互联网公开数据 标签:经济新闻,社交媒体,数据集,文本分析,自然语言处理,情感分析,金融科技,新闻传播 数据概述: 该数据集包含了来自Facebook平台的经济新闻数据,记录了与经济相关的文章和帖子。主要特征如下: 时间跨度:数据记录的时间范围为不确定,取决于数据集的创建时间。...