-
哥伦比亚_El_Tiempo_日报单日新闻提取数据_20221111
2026年1月25日 30 85 13
数据集概述 本数据集为哥伦比亚《El Tiempo》日报2022年11月11日的新闻提取数据,包含当天该报纸发布的新闻内容,以结构化格式存储,可用于新闻内容分析、媒体研究等场景,数据集仅含一个文件。 文件详解 文件名称:news_eltiempo_11-11-2022.json 文件格式:JSON...
-
MongoDB_基于文本挖掘和机器学习的女性暴力类型非结构化文本分类研究数据
2026年1月20日 30 82 80
数据集概述 本数据集包含用于女性暴力类型非结构化文本分类研究的真实新闻数据,数据提取自MongoDB数据库,记录了新闻的日期、标题和正文内容,支持通过文本挖掘和机器学习技术开展相关分析。 文件详解 文件名称:Noticias.metadata.json 文件格式:JSON...
-
Fake_News_Database_Based_事实核查虚假与真实新闻分类数据
2026年1月15日 30 132 55
数据集概述 本数据集为经过整理的事实核查新闻数据库,包含近七万条URL,覆盖虚假与真实新闻内容,并按主题分类。核心内容为事实核查的新闻条目,支持虚假新闻识别与相关研究,总计包含2个文件。 文件详解 readme.txt 文件格式:TXT 内容介绍:数据集说明文档,解释数据库构成及json文件的字段含义。 fake_news_db.json...
-
Enabling_Roll_up_and_Drill_down_Operations_新闻探索功能支持数据集
2025年12月29日 30 184 15
数据集概述 本数据集包含二十万篇新闻文章,通过命名实体链接技术将新闻实体与DBPedia关联,支持新闻探索中的钻取与汇总操作。数据集共包含四个文件,无目录结构,主要文件类型为JSON和ZIP格式,未划分训练/测试集或数据/标签集。 文件详解 relevance_evaluation_response.json 文件格式:JSON...
-
COVID-19新闻数据集
2025年6月4日 30 119 103
COVID-19新闻数据集 数据来源:互联网公开数据 标签:新闻数据,COVID-19,文本分类,自然语言处理,机器学习,疫情分析,信息抽取 数据概述:...
-
乌尔都语新闻文本大规模数据集-2021-saurabhshahane
2025年6月1日 30 15 7
乌尔都语新闻文本大规模数据集-2021-saurabhshahane 数据来源:互联网公开数据 标签:乌尔都语,新闻数据,文本处理,NLP,分类,摘要,命名实体识别,主题建模,文本生成 数据概述:...
-
巴西圣保罗报新闻数据集2024年2月前
2025年6月1日 30 17 7
巴西圣保罗报新闻数据集2024年2月前 数据来源:互联网公开数据 标签:新闻,巴西,圣保罗报,数据抓取,新闻分类,新闻内容,发布时间 数据概述:...
-
阿塞拜疆新闻数据集-2021年-natigmamishov
2025年5月31日 30 36 14
阿塞拜疆新闻数据集-2021年-natigmamishov 数据来源:互联网公开数据 标签:阿塞拜疆,新闻,数据集,文本挖掘,分类,摘要 数据概述:...
-
新闻网站页面浏览与内容分析数据集NewsWebsitePageviewsandContentAnalysis-shadabhussain
2025年5月31日 30 163 145
新闻网站页面浏览与内容分析数据集NewsWebsitePageviewsandContentAnalysis-shadabhussain 数据来源:互联网公开数据 标签:新闻数据, 页面浏览, 内容分析, 网站分析, 时间序列, 文本挖掘, 机器学习, 用户行为 数据概述:...
-
俄罗斯新闻数据集2020年
2025年4月25日 60 193 100
俄罗斯新闻数据集2020年 数据来源:互联网公开数据 标签:新闻数据,俄罗斯,文本分析,时间序列,多源数据,新闻媒体,数据预处理 数据概述:...
-
意大利电信数据集
2025年5月10日 30 199 152
意大利电信数据集 数据来源:互联网公开数据 标签:电信,意大利,米兰,Trentino,大数据,行为分析,社交网络,电力数据,天气数据,新闻数据 数据概述: 本数据集是2013年Telecom Italia Big Data...
-
Lenta-Ru新闻数据集-2019至2023年
2025年5月7日 30 156 16
Lenta-Ru新闻数据集-2019至2023年 数据来源:互联网公开数据 标签:新闻数据,俄媒,Lenta.Ru,时政,社会新闻,数据集,新闻分析 数据概述:...
-
互联网新闻综合数据集TheNewCombinedDatasets-mahmoudabusaqer
2025年5月30日 30 28 26
互联网新闻综合数据集TheNewCombinedDatasets-mahmoudabusaqer 数据来源:互联网公开数据 标签:新闻数据,数据集,文本分析,自然语言处理,机器学习,社会研究,媒体研究,信息学 数据概述:该数据集由多个互联网新闻来源整合而成,记录了广泛范围内的新闻文章内容。主要特征如下:...
-
韩国新闻文本分类数据集KoreanNewsTextClassification-jungeuncha
2025年5月30日 30 190 61
韩国新闻文本分类数据集KoreanNewsTextClassification-jungeuncha 数据来源:互联网公开数据 标签:文本分类, 新闻数据, 韩国, 情感分析, 自然语言处理, 机器学习, 多类别分类, 数据标注 数据概述: 该数据集包含来自韩国新闻报道的文本数据,记录了新闻标题、内容及其对应的类别标签。主要特征如下:...
-
Reddit新闻数据集RedditNewsDataset-sarahgonzalez
2025年5月29日 30 83 21
Reddit新闻数据集RedditNewsDataset-sarahgonzalez 数据来源:互联网公开数据 标签:新闻数据,数据集,社交媒体,自然语言处理,文本分析,机器学习,社会研究,信息科学 数据概述: 该数据集包含来自Reddit网站的新闻数据,记录了Reddit平台上发布的各种新闻文章及其相关评论。主要特征如下:...
-
网球文章数据集TennisArticleDataset-divanshu22
2025年5月29日 30 190 187
网球文章数据集TennisArticleDataset-divanshu22 数据来源:互联网公开数据 标签:网球,数据集,体育新闻,文本分析,机器学习,自然语言处理,体育研究,新闻数据 数据概述: 该数据集包含来自多个网球新闻来源的文章,记录了关于网球比赛、球员、教练和赛事的相关内容。主要特征如下:...
-
多源文本与图像综合分析数据集Multi-sourceTextandImageIntegratedAnalysisDataset-qiexifan
2025年5月29日 30 86 76
多源文本与图像综合分析数据集Multi-sourceTextandImageIntegratedAnalysisDataset-qiexifan 数据来源:互联网公开数据 标签:文本分析, 图像识别, 情感分析, 新闻数据, 社交媒体, 图像分类, 数据融合, 机器学习 数据概述:...
-
预处理新闻数据集Roberta版本新闻数据集Pre-ProcessedNewsDatasetsforRoberta-crypticghost
2025年5月29日 30 1 0
预处理新闻数据集Roberta版本新闻数据集Pre-ProcessedNewsDatasetsforRoberta-crypticghost 数据来源:互联网公开数据 标签:新闻数据集,预处理,自然语言处理,机器学习,文本分析,Roberta模型,文本分类,情感分析 数据概述:...
-
区块链新闻数据集BlockchainNewsDataset-mohammadsaifularefin
2025年5月29日 30 192 141
区块链新闻数据集BlockchainNewsDataset-mohammadsaifularefin 数据来源:互联网公开数据 标签:区块链,新闻数据,数据集,文本分析,市场研究,投资决策,经济分析,社会影响 数据概述: 该数据集包含来自互联网多个来源的区块链相关新闻,记录了与区块链技术、应用和行业动态相关的新闻报道。主要特征如下:...
-
数据2021年最新新闻数据集LatestNewsDataset2021-newsdataio
2025年5月28日 30 40 31
2021年最新新闻数据集LatestNewsDataset2021-newsdataio 数据来源:互联网公开数据 标签:新闻,数据集,文本分析,自然语言处理,机器学习,情感分析,信息检索,数据挖掘 数据概述:该数据集包含来自2021年全球各地的新闻数据,记录了各类新闻事件和报道内容。主要特征如下:...



