-
新闻标题数据集
新闻标题数据集 数据来源:互联网公开数据 标签:新闻,媒体,时间序列,新闻分析,行业趋势,数据挖掘,文本分析 数据概述: 本数据集包含了约140万条新闻标题,数据来源为《华尔街日报》和《华盛顿邮报》,时间范围覆盖2011年至2022年。数据集中的每条记录包含新闻标题、相关标签、发布时间和新闻链接,为研究新闻内容及其传播趋势提供了丰富的基础数据支持。... -
阿拉伯语假新闻与真新闻文章数据集-shyakanobledavid
阿拉伯语假新闻与真新闻文章数据集-shyakanobledavid 数据来源:互联网公开数据 标签:阿拉伯语,假新闻,真新闻,新闻,文本分析,机器学习,数据预处理 数据概述: 本数据集由多个流行的阿拉伯语新闻网站抓取,包括Misbar(https://misbar.com/)、No... -
欧洲极左极右及民粹政党概览数据集1989-2022-konradb
欧洲极左极右及民粹政党概览数据集1989-2022-konradb 数据来源:互联网公开数据 标签:民粹主义,极左,极右,政党,欧洲,政治,研究,新闻,社会学,历史 数据概述: 本数据集《PopuList... -
特斯拉股票新闻相关性分析数据集-inkger
特斯拉股票新闻相关性分析数据集-inkger 数据来源:互联网公开数据 标签:特斯拉,股票,新闻,文本分析,情感分析,市场预测,机器学习,财经 数据概述: 该数据集包含与特斯拉股票相关的各种新闻报道和相关数据,旨在用于分析新闻内容与特斯拉股票价格之间的关系。主要特征如下:... -
股票新闻情感分析数据集StockNewsSentimentAnalysisDataset-eshanrizz
股票新闻情感分析数据集StockNewsSentimentAnalysisDataset-eshanrizz 数据来源:互联网公开数据 标签:股票,新闻,情感分析,自然语言处理,数据集,金融,机器学习,文本分析 数据概述: 该数据集包含来自多个新闻网站和财经媒体的股票新闻数据,用于情感分析和量化交易研究。主要特征如下:... -
西班牙拉索拉纳镇新闻报刊文章数据集2010-2024-mgabve
西班牙拉索拉纳镇新闻报刊文章数据集2010-2024-mgabve 数据来源:互联网公开数据 标签:西班牙,拉索拉纳,新闻,报刊文章,城镇发展,NLP,文本分析,数字化 数据概述: 本数据集收录了1093篇西班牙语报刊文章,内容均关于西班牙卡斯蒂利亚-拉曼恰自治区Ciudad... -
俄罗斯乌克兰冲突新闻报道数据集-乌克兰俄罗斯冲突媒体报道2022-2023-tigboatnc
俄罗斯乌克兰冲突新闻报道数据集-乌克兰俄罗斯冲突媒体报道2022-2023-tigboatnc 数据来源:互联网公开数据 标签:俄罗斯,乌克兰,冲突,新闻,媒体报道,事件时间线,数据清理,教育,研究 数据概述:... -
基特韦新闻语言模型数据集KitweNewsLLMDataset-kavinnan
基特韦新闻语言模型数据集KitweNewsLLMDataset-kavinnan 数据来源:互联网公开数据 标签:新闻,语言模型,数据集,自然语言处理,机器学习,文本分析,信息提取,非洲研究 数据概述:该数据集包含来自赞比亚基特韦地区新闻媒体的文本数据,记录了该地区最新的新闻报道和事件。主要特征如下:... -
新闻内容与摘要生成数据集-2019年-kevintoms
新闻内容与摘要生成数据集-2019年-kevintoms 数据来源:互联网公开数据 标签:新闻,文本摘要,自然语言处理,NLP,机器学习,数据挖掘,实时数据 数据概述: 本数据集包含2019年1月份收集的新闻文章数据,旨在为文本摘要生成和分类问题提供支持。数据集包含两个主要字段: title:新闻标题,每条标题长度约为10-15字。... -
新闻组文本分类数据集20NewsgroupsDataset-aniket13r
新闻组文本分类数据集20NewsgroupsDataset-aniket13r 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,新闻,文本分析,主题建模,信息检索 数据概述: 该数据集包含了大约20,000篇新闻组文档,涵盖了20个不同的新闻组主题。主要特征如下: 时间跨度:数据收集的时间范围大约在1990年代初期。... -
HackerNews网站文章数据集HackerNewsArticlesDataset-farapopoola
HackerNews网站文章数据集HackerNewsArticlesDataset-farapopoola 数据来源:互联网公开数据 标签:Hacker News,新闻,社交媒体,数据分析,自然语言处理,文本挖掘,机器学习,网络社区 数据概述: 该数据集包含来自Hacker News网站的文章数据,记录了Hacker... -
新闻博客内容分析数据集NewsBlogsContentAnalysisDataset-rinenami
新闻博客内容分析数据集NewsBlogsContentAnalysisDataset-rinenami 数据来源:互联网公开数据 标签:新闻,博客,数据集,内容分析,自然语言处理,文本挖掘,媒体研究,机器学习 数据概述: 该数据集包含来自新闻和博客平台的内容数据,记录了各类新闻文章和博客帖子的详细信息。主要特征如下:... -
斯诺普斯新闻事实核查公众评论数据集-ambityga
斯诺普斯新闻事实核查公众评论数据集-ambityga 数据来源:互联网公开数据 标签:事实核查,新闻,评论,真伪辨别,谣言,社交媒体,舆情分析,斯诺普斯,Snopes 数据概述:... -
俄罗斯乌克兰战争相关Reddit帖子数据集-2023年5月-danhealey
俄罗斯乌克兰战争相关Reddit帖子数据集-2023年5月-danhealey 数据来源:互联网公开数据 标签:Reddit,俄乌战争,社交媒体,情感分析,新闻,公众意见,数据分析 数据概述:... -
时代杂志封面人物数据集1923-2021-darinhawley
时代杂志封面人物数据集1923-2021-darinhawley 数据来源:互联网公开数据 标签:时代杂志,封面人物,历史,名人,新闻,公众人物,年度人物,时间线,文化 数据概述:... -
新闻处理数据集NewsProcessedDataset-mario123475
新闻处理数据集NewsProcessedDataset-mario123475 数据来源:互联网公开数据 标签:新闻,数据处理,文本分析,自然语言处理,机器学习,数据挖掘,信息提取,情感分析 数据概述:该数据集包含来自互联网的新闻数据,经过预处理和清洗,适用于文本分析和自然语言处理任务。主要特征如下:... -
Meneame-net首页新闻数据集2005-2017-mrverde
Meneame-net首页新闻数据集2005-2017-mrverde 数据来源:互联网公开数据 标签:Meneame,新闻,社交网络,网页数据,投票统计,用户行为,西班牙语,社交媒体分析 数据概述:... -
乌克兰战争Reddit讨论数据集-2022至2023年-sinatavakoli
乌克兰战争Reddit讨论数据集-2022至2023年-sinatavakoli 数据来源:互联网公开数据 标签:乌克兰战争,Reddit,讨论,数据分析,公众意见,新闻,趋势分析,情感分析,话题建模 数据概述:... -
BBC新闻文章分类数据集-2000s至2010s-willianoliveiragibin
BBC新闻文章分类数据集-2000s至2010s-willianoliveiragibin 数据来源:互联网公开数据 标签:BBC,新闻,文本分类,自然语言处理,机器学习,情感分析,政治,体育,娱乐,科技,商业 数据概述:... -
俄罗斯新闻标题用于点击诱饵文章分类2023-anzerone
俄罗斯新闻标题用于点击诱饵文章分类2023-anzerone 数据来源:互联网公开数据 标签:新闻,标题,分类,自然语言处理,点击诱饵,文本分析,俄语 数据集描述: 本数据集包含过去几个月内从多个俄罗斯新闻网站收集的新闻文章。该数据集的创建目的是为了开发和测试不同的自然语言处理(NLP)模型,以及构建用于文本分类(识别点击诱饵与非点击诱饵标题)的模型。...