找到147个数据集

标签: 新闻文章

过滤结果
  • Enabling_Roll_up_and_Drill_down_Operations_新闻探索功能支持数据集

    2025年12月29日 30 123 27

    数据集概述 本数据集包含二十万篇新闻文章,通过命名实体链接技术将新闻实体与DBPedia关联,支持新闻探索中的钻取与汇总操作。数据集共包含四个文件,无目录结构,主要文件类型为JSON和ZIP格式,未划分训练/测试集或数据/标签集。 文件详解 relevance_evaluation_response.json 文件格式:JSON...
    packageimg
  • Cross_Domain_Propaganda_Detection_印度社交媒体CAA抗议活动宣传检测数据集

    2025年12月29日 30 199 76

    数据集概述 本数据集聚焦印度2019年CAA抗议活动相关的社交媒体内容,包含464篇新闻文章(按句子分类为宣传或非宣传)和597条手动标注18种宣传技术的推文,用于跨域宣传检测任务,为相关研究提供结构化标注数据。 文件详解 文件名称:Dataset.zip 文件格式:ZIP...
    packageimg
  • NewsUnravel媒体偏见检测数据集2023

    2025年12月21日 30 179 66

    数据集概述 该数据集通过NewsUnravel网站的用户反馈机制收集,包含新闻文章中机器生成偏见高亮句的读者反馈数据,含偏见句子二元标签、文章元数据及用户反馈记录,用于提升媒体偏见检测模型性能,是首个媒体偏见领域人在回路数据收集应用的成果。 文件详解 该数据集包含6个文件,具体说明如下: - NUDAdataset.csv:...
    packageimg
  • 印地语文本宣传数据集2023_Prop_HiT

    2025年12月21日 30 76 70

    数据集概述 本数据集是针对印地语文本的宣传检测数据集,包含来自三十二家印地语新闻网站的七百九十篇文章,采用人工标注方式标记十八种宣传技术。数据按训练集(五百五十篇)和测试集(二百四十篇)划分,为印地语宣传内容识别研究提供结构化标注数据。 文件详解 该数据集包含以下文件: - 压缩包文件: - Prop-HiT Dataset.zip:...
    packageimg
  • 印度时报新闻文章FinBERT评分数据集

    2025年12月19日 30 160 10

    数据集概述 本数据集包含从印度时报档案提取的新闻文章及其FinBERT评分结果,覆盖2017至2024年多个年份,以CSV、XLSX和PNG格式存储,为分析新闻文本的情感倾向提供结构化数据支持。 文件详解 CSV格式评分文件(共7个): 命名示例:score_TOI_2017.csv、score_TOI_2021.csv等...
    packageimg
  • Webis_Revenue_10_德国新闻营收声明标注数据集

    2025年12月11日 30 78 51

    数据集概述 该数据集包含2003至2009年德国29家新闻网站的1128篇新闻文章,由领域专家手动标注了2075条企业或市场营收声明,每条声明包含7个核心属性,为研究新闻文本中的营收信息提取提供标注数据支持。 文件详解 压缩数据文件:...
    packageimg
  • 西班牙数字媒体生物精炼厂报道话语分析数据集2019_2024

    2025年12月10日 30 68 4

    数据集概述 本数据集是针对西班牙数字媒体中生物精炼厂相关报道的话语分析研究完整资料包,涵盖2019年11月至2024年11月的三百五十篇文章,涉及八十八家生物精炼厂,包含编码数据库、SPSS分析文件、统计输出等多类资料,用于研究可再生能源技术的社会接受度。 文件详解 数据库文件: BBDD-Analisis-...
    packageimg
  • 美国鱼类和野生动物管理局新闻文章文档集

    2025年12月6日 30 123 91

    数据集概述 本数据集为美国鱼类和野生动物管理局(FWS)Servcat系统中的新闻文章文档归档,通过抓取该系统获取,包含与美国鱼类和野生动物资源管理相关的报告、备忘录等资料,以压缩文件形式存储。 文件详解 文件名称:Newsletter_Article.zip 文件格式:ZIP(.zip)...
    packageimg
  • 基于众包的新闻偏见分析与检测多维数据集

    2025年12月5日 30 110 20

    数据集概述 本数据集包含九千篇涉及乌克兰危机的新闻文章中的两千零五十七句内容,由众包工作者对新闻偏见本身及隐藏假设、主观性、表征倾向三个维度进行标注,总计四万四千五百四十七个标签,为新闻偏见的分析与检测研究提供多维标注数据支持。 文件详解 文件名称: all-data-as-json.zip 文件格式: ZIP压缩包(.zip) 内容说明:...
    packageimg
  • CT_FAN多语言假新闻检测数据集2022

    2025年12月5日 30 124 118

    数据集概述 该数据集为多语言假新闻检测任务设计,包含2010-2022年英文和德文新闻文章,标注其真实性评级(假、部分假、真、其他)及主题领域,支持跨语言迁移学习研究,适用于构建多语言假新闻分类模型。 文件详解 文件名称:FakeNews_Task3_2022.zip 文件格式:ZIP压缩包 内部数据字段: ID:新闻文章唯一标识符...
    packageimg
  • 新闻摘要生成文章数据集

    2025年10月9日 30 20 4

    新闻摘要生成文章数据集_News_Article_Summarization_Dataset 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 新闻文章, 机器翻译, 深度学习, 文本生成, 数据集, 摘要生成 数据概述: 该数据集包含来自新闻网站的文章及其对应的摘要,旨在用于训练和评估文本摘要模型。主要特征如下:...
    packageimg
  • 越南新闻文章内容分词与处理数据集

    2025年10月5日 30 188 65

    越南新闻文章内容分词与处理数据集_Vietnamese_News_Articles_Content_Segmentation_and_Processing 数据来源:互联网公开数据 标签:自然语言处理, 文本分析, 越南语, 分词, 新闻文章, 文本摘要, 信息抽取, 语言模型 数据概述:...
    packageimg
  • 新闻摘要生成CNN_每日邮报数据集

    2025年10月3日 30 64 53

    新闻摘要生成CNN_每日邮报数据集_News_Summary_Generation_CNN_DailyMail_Dataset 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 新闻文章, 深度学习, 机器翻译, 文本生成, CNN, 每日邮报 数据概述: 该数据集包含来自CNN和每日邮报网站的新闻文章和对应的摘要。主要特征如下:...
    packageimg
  • 越南新闻文章内容分类数据集

    2025年9月24日 30 116 76

    越南新闻文章内容分类数据集_Vietnam_News_Articles_Content_Classification 数据来源:互联网公开数据 标签:新闻文章, 内容分类, 文本分析, 越南语, 自然语言处理, 机器学习, 时事新闻, 数据集 数据概述:...
    packageimg
  • 新闻文章内容情感分析数据集

    2025年7月3日 30 192 102

    新闻文章内容情感分析数据集_News_Article_Content_Sentiment_Analysis 数据来源:互联网公开数据 标签:情感分析, 自然语言处理, 文本挖掘, 新闻文章, 情感分类, 数据标注, 机器学习, 舆情分析 数据概述: 该数据集包含来自新闻媒体的文章内容,记录了用于情感分析的文本数据。主要特征如下:...
    packageimg
  • 欧盟反假信息项目收集的虚假信息与反假信息案例数据集-2015至2020年-corrieaar

    2025年6月1日 30 176 77

    欧盟反假信息项目收集的虚假信息与反假信息案例数据集-2015至2020年-corrieaar 数据来源:互联网公开数据 标签:假信息,反假信息,欧盟,克里姆林支持媒体,信息传播,数据集,API,新闻文章,目标国家,话题分析,叙事研究,数据挖掘 数据概述:...
    packageimg
  • 德国新闻文章内容分类数据集-dirkbahle

    2025年6月1日 30 2 0

    德国新闻文章内容分类数据集-dirkbahle 数据来源:互联网公开数据 标签:德国新闻,新闻文章,文本分析,自然语言处理,内容分类,新闻爬取,文本数据,时事新闻 数据概述:...
    packageimg
  • 越南劳动报新闻文章数据集-2022年5月19日

    2025年5月31日 30 77 43

    越南劳动报新闻文章数据集-2022年5月19日 数据来源:互联网公开数据 标签:新闻,越南,劳动报,NLP,文本分析,文章,爬取数据,自然语言处理 数据概述: 本数据集抓取自越南劳动报2022年5月19日的新闻文章,未经任何数据处理。数据集包含文章的多种属性,旨在为自然语言处理(NLP)任务提供数据支持。 数据包含以下字段: URL:文章链接。...
    packageimg
  • Fibe黑客挑战赛新闻文章分类数据集-2021

    2025年5月31日 30 208 170

    Fibe黑客挑战赛新闻文章分类数据集-2021 数据来源:互联网公开数据 标签:AI挑战赛,新闻文章,文本分类,机器学习,数据处理,深度学习,分类模型 数据概述: 本数据集来源于Fibe举办的“Hack the Vibe! 2.0”...
    packageimg
  • 摩洛哥阿拉伯语新闻文章数据集MNAD-jmourad100

    2025年5月31日 30 67 8

    摩洛哥阿拉伯语新闻文章数据集MNAD-jmourad100 数据来源:互联网公开数据 标签:阿拉伯语,新闻文章,文本分类,自然语言处理,数据挖掘,信息检索,摩洛哥,文本分析 数据概述: MNAD(Moroccan News Articles...
    packageimg