-
带时间戳的文本标注数据集-vanniagm
带时间戳的文本标注数据集-vanniagm 数据来源:互联网公开数据 标签:文本数据,时间戳,标注,自然语言处理,数据集,文本分析,信息抽取,机器学习 数据概述: 该数据集包含带时间戳的文本数据,记录了文本内容及其对应的时间信息。主要特征如下: 时间跨度:数据记录的时间范围取决于原始文本数据的时间跨度,可能从数小时到数年不等。... -
法语维基百科数据集WikiFrenchDataset-manueldesiretaira
法语维基百科数据集WikiFrenchDataset-manueldesiretaira 数据来源:互联网公开数据 标签:维基百科,法语,数据集,自然语言处理,文本分析,机器学习,语言学,学术资源 数据概述:该数据集包含来自法语维基百科的数据,记录了维基百科中各个条目的内容。主要特征如下: 时间跨度:数据记录的时间范围从2001年到2023年。... -
仇恨言论检测数据集HASOC英文数据集1-ritankardas
仇恨言论检测数据集HASOC英文数据集1-ritankardas 数据来源:互联网公开数据 标签:自然语言处理,仇恨言论检测,文本分类,社交媒体,数据集,机器学习,情感分析,舆情分析 数据概述: 该数据集包含来自社交媒体平台的英文文本数据,用于仇恨言论检测任务。主要特征如下: 时间跨度:数据记录的时间范围未知,但包含了近期社交媒体上的文本数据。... -
招聘信息分类数据集JobSearchClassifiedsDataset-vrashad
招聘信息分类数据集JobSearchClassifiedsDataset-vrashad 数据来源:互联网公开数据 标签:招聘,分类,文本分析,自然语言处理,机器学习,数据集,职位描述,就业市场 数据概述: 该数据集包含来自招聘网站的分类信息,记录了各类招聘信息的数据。主要特征如下:... -
标注训练序列描述数据集AnnotatedTrainSeriesDescriptionsDataset-llleeeoooh
标注训练序列描述数据集AnnotatedTrainSeriesDescriptionsDataset-llleeeoooh 数据来源:互联网公开数据 标签:列车描述,数据集,自然语言处理,文本标注,机器学习,交通分析,铁路系统,文本挖掘 数据概述:该数据集包含来自多个来源的标注了列车序列的详细描述数据,适用于自然语言处理和文本分析等任务。主要特征如下:... -
语言模型检测训练与测试数据集LLM检测训练测试数据集-johnsonl8
语言模型检测训练与测试数据集LLM检测训练测试数据集-johnsonl8 数据来源:互联网公开数据 标签:语言模型,检测,数据集,训练,测试,自然语言处理,机器学习,安全技术 数据概述:该数据集包含用于语言模型检测的训练和测试数据,记录了不同类型文本的特征和标签,适用于语言模型的检测和评估任务。主要特征如下:... -
Keras深度学习框架数据集KerasData-anouargmili
Keras深度学习框架数据集KerasData-anouargmili 数据来源:互联网公开数据 标签:深度学习,Keras,数据集,图像识别,文本分析,自然语言处理,机器学习,计算机视觉 数据概述: 该数据集包含了Keras深度学习框架中常用的示例数据集,涵盖了图像,文本,序列等多种数据类型,方便用户进行模型构建和训练。主要特征如下:... -
IMDb电影评分数据集IMDbRatingDataset-paddytheprogrammer
IMDb电影评分数据集IMDbRatingDataset-paddytheprogrammer 数据来源:互联网公开数据 标签:电影评分,数据集,电影分析,推荐系统,深度学习,自然语言处理,电影评论,用户行为 数据概述: 该数据集包含来自IMDb的电影评分数据,记录了用户对电影的评分和评论。主要特征如下:... -
新浪滚动新闻数据集SinaaRollNewsDataset-cugytt
新浪滚动新闻数据集SinaaRollNewsDataset-cugytt 数据来源:互联网公开数据 标签:新闻,文本分析,自然语言处理,数据集,舆情分析,情感分析,新闻推荐,中文 数据概述: 该数据集包含来自新浪网的滚动新闻数据,记录了新闻标题,发布时间,新闻内容等信息。主要特征如下:... -
机器学习特征提取与CommonLit数据集MLFeaturesCommonLitDataset-bulivington
机器学习特征提取与CommonLit数据集MLFeaturesCommonLitDataset-bulivington 数据来源:互联网公开数据 标签:机器学习,特征提取,数据集,文本分析,自然语言处理,教育研究,情感分析,文本分类 数据概述: 该数据集包含来自CommonLit平台的文本数据,记录了用于机器学习特征提取的文本样本。主要特征如下:... -
写作过程与质量数据集WritingProcesstoQualityDataset-zainalinasir
写作过程与质量数据集WritingProcesstoQualityDataset-zainalinasir 数据来源:互联网公开数据 标签:写作过程,文本质量,数据集,自然语言处理,机器学习,学术研究,教育,文本分析 数据概述: 该数据集包含写作过程中生成的文本及其对应的文本质量评分,记录了写作过程的关键步骤和最终产出的质量。主要特征如下:... -
数据2012年至当前股票新闻数据集StocksNewsfrom2012Dataset-vasiliispe
2012年至当前股票新闻数据集StocksNewsfrom2012Dataset-vasiliispe 数据来源:互联网公开数据 标签:股票市场,新闻分析,数据集,文本挖掘,机器学习,金融分析,自然语言处理,市场研究 数据概述: 该数据集包含从2012年开始的股票市场相关新闻数据,记录了与股票市场相关的新闻报道和评论。主要特征如下:... -
短信垃圾邮件分类数据集SMSSpamorHamDataset-muhammeddalkran
短信垃圾邮件分类数据集SMSSpamorHamDataset-muhammeddalkran 数据来源:互联网公开数据 标签:文本分类,垃圾邮件,数据集,自然语言处理,机器学习,短信分析,通信安全,数据挖掘 数据概述: 该数据集包含来自公开来源的短信数据,记录了短信内容的分类信息,主要用于区分垃圾短信和正常短信。主要特征如下:... -
比特币推特情感分析数据集BitcoinTweetsSentimentAnalysisDataset-aslanovmustafa
比特币推特情感分析数据集BitcoinTweetsSentimentAnalysisDataset-aslanovmustafa 数据来源:互联网公开数据 标签:社交媒体,比特币,情感分析,数据集,机器学习,金融科技,自然语言处理,市场预测 数据概述:... -
Facebook帖子评论图像评论数据集-tonmoyabdullah
Facebook帖子评论图像评论数据集-tonmoyabdullah 数据来源:互联网公开数据 标签:社交媒体,数据集,图像分析,情感分析,自然语言处理,计算机视觉,用户行为,文本挖掘 数据概述: 该数据集包含来自Facebook平台的帖子,评论,图像以及评论的详细信息。主要特征如下: 时间跨度:数据记录的时间范围未知,但通常涵盖了社交媒体活跃时期。... -
数据2023年猎头职位发布数据集-romankurzakov
2023年猎头职位发布数据集-romankurzakov 数据来源:互联网公开数据 标签:招聘,职位,猎头,数据分析,自然语言处理,文本挖掘,行业分析,就业市场 数据概述: 该数据集包含来自猎头公司发布的职位信息,记录了2023年期间发布的46000条职位招聘数据。主要特征如下: 时间跨度:数据记录的时间范围为2023年全年。... -
京都餐厅评论与评分数据集KyotoRestaurantReviewandRatingDataset-rychen10
京都餐厅评论与评分数据集KyotoRestaurantReviewandRatingDataset-rychen10 数据来源:互联网公开数据 标签:餐厅,评论,评分,数据集,美食,日本,京都,自然语言处理 数据概述: 该数据集包含来自日本京都地区的餐厅评论和评分数据,记录了用户对餐厅的评价。主要特征如下:... -
最终内容数据集FinalContentDataset-akash1vishwakarma
最终内容数据集FinalContentDataset-akash1vishwakarma 数据来源:互联网公开数据 标签:内容分析,数据集,文本挖掘,自然语言处理,机器学习,数据分析,信息提取,知识管理 数据概述:该数据集包含来自多个来源的内容数据,记录了各类文本内容的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
预训练BERT大型语言模型数据集PreprosBERTLargeDataset-fattahpradiptak
预训练BERT大型语言模型数据集PreprosBERTLargeDataset-fattahpradiptak 数据来源:互联网公开数据 标签:自然语言处理,BERT模型,数据集,机器学习,文本分析,深度学习,语言学,人工智能 数据概述: 该数据集为BERT大型语言模型的预训练数据,主要包含用于训练BERT模型的文本数据。主要特征如下:... -
抑郁症和焦虑症患者数据集DepressionandAnxietyPatientDataset-basitkhan12
抑郁症和焦虑症患者数据集DepressionandAnxietyPatientDataset-basitkhan12 数据来源:互联网公开数据 标签:心理健康,抑郁症,焦虑症,数据集,文本分析,自然语言处理,情感分析,医疗健康 数据概述: 该数据集包含来自社交媒体平台的用户生成内容,记录了用户关于抑郁症和焦虑症的讨论及相关情绪表达。主要特征如下:...