找到98个数据集

标签: 新闻标题

过滤结果
  • 新冠疫情时间线_巴西科学部数据集

    2026年2月12日 30 151 14

    数据集概述 本数据集为巴西COVID-19时间线项目的核心数据,通过在线信息采集整理巴西主流媒体及联邦机构发布的COVID-19相关新闻事件,记录2020年2月26日(巴西首例确诊日)至2022年3月24日的关键事件,包含多版本更新的Excel及CSV文件,用于构建交互式时间线展示。 文件详解 Excel文件(共2个) 文件名称:planilha...
    packageimg
  • Granma_2019_古巴农业主题新闻报道数据集

    2026年2月9日 30 36 16

    数据集概述 本数据集记录了2019年古巴《Granma》日报中所有与农业主题相关的新闻报道信息,为研究该年度古巴农业领域媒体报道情况提供结构化数据支持。数据集包含1个文件,无分层目录结构。 文件详解 文件名称:z periódico Granma 2019.xlsx 文件格式:XLSX...
    packageimg
  • VAW_Based暴力侵害妇女新闻文本挖掘研究数据

    2026年2月9日 30 204 119

    数据集概述 本数据集为暴力侵害妇女(VAW)相关研究的文本挖掘数据,包含从MongoDB数据库提取的真实VAW新闻内容,记录新闻的日期、标题及正文,用于通过文本挖掘技术开展主题建模研究,探索VAW相关社会问题。 文件详解 Noticias.metadata.json 文件格式:JSON...
    packageimg
  • BabylonBee_Based_多模态讽刺幽默标注数据集

    2026年1月29日 30 76 44

    数据集概述 本数据集为多模态(图像+文本)讽刺研究设计,包含一万零八百八十九条人工标注样本,来源于讽刺内容网站https://babylonbee.com/。数据区分讽刺内容的幽默属性及认知机制,支持多模态讽刺识别、幽默机制分析等研究,含两个核心文件。 文件详解 README.docx 文件格式:DOCX...
    packageimg
  • dsfsi_Based非洲语言新闻语料库2022

    2026年2月1日 30 154 102

    数据集概述 本数据集为2022年的isiZulu新闻(含文章及标题)与Siswati新闻(仅标题)语料库,包含相关非洲语言的新闻文本资源,支持非洲语言的自然语言处理研究,数据集以单个压缩文件形式呈现。 文件详解 文件名称:dsfsi/za-isizulu-siswati-news-2022-v0.9.5.zip 文件格式:ZIP...
    packageimg
  • IN_FINews_Based_印度股市多行业新闻数据集2025

    2026年1月28日 30 159 5

    数据集概述 本数据集为印度股市新闻数据集,源自印度电子新闻文章,覆盖2025年2月至8月共六个月,包含3348篇涉及汽车、银行、医疗、IT等多行业的新闻。数据集适用于自然语言处理实验及机器学习模型开发,支持文章分类等任务,包含2个数据文件。 文件详解 IN-FINews Dataset.json 文件格式:JSON...
    packageimg
  • 哥伦比亚_El_Tiempo_日报单日新闻提取数据_20221111

    2026年1月25日 30 101 69

    数据集概述 本数据集为哥伦比亚《El Tiempo》日报2022年11月11日的新闻提取数据,包含当天该报纸发布的新闻内容,以结构化格式存储,可用于新闻内容分析、媒体研究等场景,数据集仅含一个文件。 文件详解 文件名称:news_eltiempo_11-11-2022.json 文件格式:JSON...
    packageimg
  • Wikidata_Based_新闻标题到知识图谱事件类映射评估数据集

    2026年1月25日 30 164 58

    数据集概述 本数据集是基于Wikidata构建的新闻标题到事件类映射语料库,用于支持新闻标题与知识图谱中事件类的关联评估框架研究。数据集包含1个JSON文件,无训练测试、数据标签或原始处理数据的拆分,为新闻事件分类映射任务提供基础数据支持。 文件详解 文件名称:news_event_identication_dataset.json 文件格式:JSON...
    packageimg
  • CyberSecNews_Based_德英网络安全新闻人工分类标注数据集

    2026年1月21日 30 15 14

    数据集概述 本数据集包含457篇德语和英语新闻文章,通过RSS源从各类新闻网站和博客收集。每篇文章经AIT数字安全与安全中心同事人工分类,标注为“网络安全”“非网络安全”或“不确定”,并提供文章标题、内容、语言、来源、发布时间、版权声明及参与者分类结果等信息,无缺失值。 文件详解 文件名称:cybersec_news_de_en.json...
    packageimg
  • FalleDesinfo_ES_Based_西班牙语名人死亡真假新闻数据集

    2026年1月21日 30 143 66

    数据集概述 本数据集包含三十三条西班牙语名人死亡相关新闻,分为三类:十一篇2024年6月18日传播的诺姆·乔姆斯基假死误信新闻、十一篇同日辟谣的真实新闻、十一篇2018年3月14日史蒂芬·霍金逝世的真实新闻。每条新闻含类型、唯一标识、发布日期、标题、摘要及正文,用于虚假新闻分类研究。 文件详解 文件名称:FalleDesinfo_ES.xlsx...
    packageimg
  • Human_labeled_Based_政治新闻议题与博弈框架人工标注语料库

    2026年1月20日 30 209 180

    数据集概述 本数据集是包含议题与博弈框架的人工标注新闻文章语料库,源自《纽约时报》和《洛杉矶时报》的在线政治新闻,涵盖2020年美国大选、特朗普弹劾等五个主题。语料库标注了句法、语义、语用等多层面语言特征,包含100篇新闻文章及相关标题、图片描述,总计一个文件。 文件详解 文件名称:Manual annotation.xlsx 文件格式:XLSX...
    packageimg
  • PACO_Based_哥伦比亚透明度秘书处反腐败新闻整合数据2020_2023

    2026年1月20日 30 48 32

    数据集概述 本数据集为2020-2023年哥伦比亚反腐败门户网站(PACO)收录的腐败相关新闻整合数据,由哥伦比亚透明度秘书处提供。数据涵盖该时间段内平台登记的腐败新闻信息,是研究哥伦比亚反腐败监督及腐败事件动态的结构化资料。 文件详解 文件名称:NOTICIAS_PACO-CONSOLIDADO V2.xlsx 文件格式:XLSX...
    packageimg
  • Sentiment_Analysis_Based_奥运会遗产新闻多分类器情感分析结果数据

    2026年1月13日 30 85 56

    数据集概述 本数据集包含基于三个分类器融合的奥运会遗产新闻情感分析结果,覆盖2012年伦敦和2016年里约奥运会遗产相关的1271篇新闻。数据通过Google搜索获取,对新闻标题和正文分别进行情感分类,最终输出14个Excel文件,记录新闻的搜索排名、发布日期、链接、标题及对应的情感标签。 文件详解...
    packageimg
  • Studio_Ghibli_Trend_Media_Narrative_Study_Data

    2026年1月12日 30 131 46

    数据集概述 本数据集围绕“吉卜力趋势”(Ghibli Trend)相关媒体叙事展开,包含2025年3月25日至4月2日期间提及该现象的新闻标题数据,用于支持相关论文对该 viral 活动媒体叙事的分析研究。 文件详解 文件名称:ghibli.xlsx 文件格式:XLSX...
    packageimg
  • NKK_GitHub_Covid_19_美国孟加拉国新闻报道完整数据

    2025年12月15日 30 156 53

    数据集概述 本数据集包含美国和孟加拉国的COVID-19相关在线新闻报道,其中美国数据集含一千篇来自《华盛顿邮报》《星论坛报》的报道,孟加拉国数据集含五十篇来自《每日星报》《普罗托姆·阿洛报》的报道,为COVID-19新闻的NLP研究提供数据支持。 文件详解 文件名称: USA -...
    packageimg
  • 企业ESG自动评估媒体报道数据挖掘与评估数据集

    2025年12月7日 30 85 73

    数据集概述 本数据集是企业ESG自动评估研究的复现包,包含标注为环境、治理或社会相关的四万三千二百四十一篇新闻标题语料库,以及用于公司检测、ESG分类和情感模型训练评估的代码笔记本,为ESG相关NLP任务提供基准数据。 文件详解 标注语料库文件:...
    packageimg
  • 古吉拉特语与英语新闻标题分类数据集

    2025年10月30日 30 93 10

    古吉拉特语与英语新闻标题分类数据集_Gujarati_and_English_News_Headline_Classification_Dataset 数据来源:互联网公开数据 标签:文本分类,新闻标题,多语言,古吉拉特语,英语,情感分析,机器学习,自然语言处理 数据概述:...
    packageimg
  • 泰国文本摘要数据集

    2025年6月1日 30 116 109

    泰国文本摘要数据集 数据来源:互联网公开数据 标签:文本摘要,泰语,新闻分类,摘要生成,自然语言处理,新闻标题,语言建模 数据概述:...
    packageimg
  • 印度新闻标题数据集IndiaNewsHeadlinesDataset-amit1992

    2025年5月29日 30 169 54

    印度新闻标题数据集IndiaNewsHeadlinesDataset-amit1992 数据来源:互联网公开数据 标签:新闻分析,数据集,文本挖掘,自然语言处理,新闻媒体,数据科学,机器学习,印度研究 数据概述: 该数据集包含来自印度新闻媒体平台的新闻标题数据,记录了印度国内外的新闻事件和热点话题。主要特征如下:...
    packageimg
  • 澳大利亚新闻标题文本分析数据集AustralianNewsHeadlinesTextAnalysis-navidkhezrian

    2025年5月28日 30 136 131

    澳大利亚新闻标题文本分析数据集AustralianNewsHeadlinesTextAnalysis-navidkhezrian 数据来源:互联网公开数据 标签:新闻标题, 文本分析, 自然语言处理, 时间序列分析, 舆情分析, 澳大利亚, 数据挖掘, 情感分析 数据概述: 该数据集包含来自澳大利亚广播公司(ABC...
    packageimg