-
乌克兰危机背景下法国政治言论数据集Ukraine-FrenchCrisisPoliticalDiscourseDataset-khemkhammohamed
乌克兰危机背景下法国政治言论数据集Ukraine-FrenchCrisisPoliticalDiscourseDataset-khemkhammohamed 数据来源:互联网公开数据 标签:乌克兰危机,法国,政治言论,文本分析,情感分析,舆情分析,自然语言处理,国际关系 数据概述:... -
英语词汇频率统计数据集WordsCSVDataset-jasperbutcher
英语词汇频率统计数据集WordsCSVDataset-jasperbutcher 数据来源:互联网公开数据 标签:自然语言处理,文本分析,词频统计,数据集,语言学,词汇学习,机器学习,统计分析 数据概述: 该数据集包含了来自互联网的大量文本数据,记录了英语词汇的出现频率。主要特征如下:... -
阿拉伯诗歌韵律模式数据集ArabicPoemPatternDataset-m7mdalbaddawi
阿拉伯诗歌韵律模式数据集ArabicPoemPatternDataset-m7mdalbaddawi 数据来源:互联网公开数据 标签:诗歌,韵律,阿拉伯文学,数据集,语言研究,文本分析,文化研究,机器学习 数据概述: 该数据集包含来自阿拉伯文学领域的诗歌韵律数据,记录了阿拉伯诗歌的韵律模式,结构和风格特征。主要特征如下:... -
StackOverflow问答数据集StackOverflowQuestionsDataset-sukuzhanay
StackOverflow问答数据集StackOverflowQuestionsDataset-sukuzhanay 数据来源:互联网公开数据 标签:问答系统,编程,数据集,自然语言处理,文本分析,机器学习,开发者社区,数据挖掘 数据概述:该数据集包含来自 Stack Overflow... -
歌曲创作与语言分析平台歌词数据集
歌曲创作与语言分析平台歌词数据集 数据来源:互联网公开数据 标签:歌词,音乐,歌曲,语言,文本分析,自然语言处理,创作,文化,流派 数据概述:... -
Reddit短内容数据集RedditShortDataset-swathikone
Reddit短内容数据集RedditShortDataset-swathikone 数据来源:互联网公开数据 标签:社交媒体,文本分析,数据集,情感分析,机器学习,自然语言处理,网络行为,内容分类 数据概述:该数据集包含来自Reddit平台的短内容数据,记录了用户发布在各个板块的简短文本信息。主要特征如下:... -
arXiv论文摘要数据集FDL-Arxiv-FinalDataset-alssioalfonso
arXiv论文摘要数据集FDL-Arxiv-FinalDataset-alssioalfonso 数据来源:互联网公开数据 标签:自然语言处理,机器学习,论文摘要,文本分析,数据集,学术研究,论文推荐,深度学习 数据概述: 该数据集包含来自arXiv(预印本服务器)的论文摘要数据,主要用于自然语言处理,机器学习等相关研究。主要特征如下:... -
今日俄罗斯新闻Telegram频道头条新闻数据集-2013年至2023年12月22日-goshaserbin
今日俄罗斯新闻Telegram频道头条新闻数据集-2013年至2023年12月22日-goshaserbin 数据来源:互联网公开数据 标签:俄罗斯,新闻,Telegram,头条新闻,政治,社会,国际关系,媒体,时间序列,文本分析 数据概述: 本数据集收录了今日俄罗斯(RT, Russia... -
金融新闻情感分析数据集EliciaNewsFinBERTDataset-a0204261w
金融新闻情感分析数据集EliciaNewsFinBERTDataset-a0204261w 数据来源:互联网公开数据 标签:金融新闻,情感分析,自然语言处理,数据集,机器学习,文本分析,金融科技,新闻媒体 数据概述: 该数据集包含来自Elicia新闻的金融新闻数据,记录了新闻文章及其对应的情感标签。主要特征如下:... -
欧洲议会代词数据集ItalianLanguagePronounDataset-harshitdhankhar
欧洲议会代词数据集ItalianLanguagePronounDataset-harshitdhankhar 数据来源:互联网公开数据 标签:语言处理,数据集,自然语言,机器学习,文本分析,意大利语,代词研究,多语言 数据概述: 该数据集来源于欧洲议会会议记录,专注于意大利语中的代词使用情况。主要特征如下:... -
美国和加州立法提案摘要数据集-undersc0re
美国和加州立法提案摘要数据集-undersc0re 数据来源:互联网公开数据 标签:立法,提案,摘要,文本分析,自然语言处理,美国,加州,法律,文本长度 数据概述: 本数据集包含了美国联邦立法提案和加州立法提案的摘要信息,总计超过23000条记录。数据分为训练集(train)、加州测试集(ca_test)和测试集(test)三个部分。... -
欺凌事件标注数据集2018年-felicitaarcadia
欺凌事件标注数据集2018年-felicitaarcadia 数据来源:互联网公开数据 标签:欺凌,校园欺凌,数据集,文本分析,自然语言处理,情感分析,社会学,教育 数据概述: 该数据集包含2018年收集的欺凌事件相关文本数据,记录了各种形式的欺凌行为描述。主要特征如下: 时间跨度:数据记录的时间范围为2018年。... -
国际法律信息检索竞赛COLIEE2024图卷积网络数据集COLIEE2024GCNDataset-nguynkhnhhuyn
国际法律信息检索竞赛COLIEE2024图卷积网络数据集COLIEE2024GCNDataset-nguynkhnhhuyn 数据来源:互联网公开数据 标签:法律文本,信息检索,图卷积网络,数据集,自然语言处理,机器学习,法律科技,文本分析 数据概述: 该数据集来源于国际法律信息检索竞赛(COLIEE... -
推特社交平台网络欺凌数据集TwitterCyberbullyingDataset-saitejave
推特社交平台网络欺凌数据集TwitterCyberbullyingDataset-saitejave 数据来源:互联网公开数据 标签:社交媒体,网络欺凌,数据集,文本分析,情感分析,自然语言处理,机器学习,社会学 数据概述:... -
孟加拉电子产品分词数据集BanglaElectronicsLemmatizedFinalDataset-nirajmahi
孟加拉电子产品分词数据集BanglaElectronicsLemmatizedFinalDataset-nirajmahi 数据来源:互联网公开数据 标签:电子产品,数据集,分词,自然语言处理,机器学习,文本分析,语言学,数据挖掘 数据概述: 该数据集包含来自孟加拉国电子产品领域的分词数据,记录了电子产品相关的文本信息。主要特征如下:... -
EMNIST字母图像数据集EMNISTLettersDataset-mzaink14
EMNIST字母图像数据集EMNISTLettersDataset-mzaink14 数据来源:互联网公开数据 标签:图像识别,字符识别,数据集,机器学习,深度学习,计算机视觉,文本分析,字母 数据概述: 该数据集包含来自EMNIST项目的字母图像数据,主要用于训练和评估字母识别模型。主要特征如下: 时间跨度:数据记录的时间范围为数据集创建时期。... -
口述历史访谈记录数据集LokisTranscriptDataset-anomic
口述历史访谈记录数据集LokisTranscriptDataset-anomic 数据来源:互联网公开数据 标签:口述历史,访谈记录,数据集,历史研究,文本分析,社会研究,语言处理,人文科学 数据概述:该数据集包含来自口述历史项目的访谈记录,记录了个人口述历史访谈的完整文本内容。主要特征如下: 时间跨度:数据记录的时间范围从20世纪初到现代。... -
数据2024年数据科学学生锦标赛专利摘要分类数据集-lokeshsgupta
2024年数据科学学生锦标赛专利摘要分类数据集-lokeshsgupta 数据来源:互联网公开数据 标签:专利,摘要,分类,EPO,欧洲专利局,机器学习,文本分析,数据科学,竞赛,标签 数据概述:... -
阿达尼集团相关推文数据集TweetsonAdani10kDataset-vidiptvashist
阿达尼集团相关推文数据集TweetsonAdani10kDataset-vidiptvashist 数据来源:互联网公开数据 标签:社交媒体,数据集,文本分析,情感分析,舆情监测,机器学习,自然语言处理,商业研究 数据概述: 该数据集包含来自社交媒体平台Twitter(推文)的公开数据,记录了与阿达尼集团(Adani... -
信息科学582挑战赛数据集-saranga7
信息科学582挑战赛数据集-saranga7 数据来源:互联网公开数据 标签:机器学习,数据集,文本分析,自然语言处理,情感分析,社交媒体,竞赛,新闻 数据概述:该数据集包含来自信息科学582挑战赛的数据,主要记录了与新闻文章相关的文本数据。主要特征如下: 时间跨度:数据记录的时间范围,涵盖了挑战赛期间的新闻文章。...