找到258个数据集

标签: 新闻分类

过滤结果
  • HornMT_Based_非洲之角多语言机器翻译基准平行语料数据集

    2026年1月27日 30 198 27

    数据集概述 本数据集是针对非洲之角语言的机器翻译基准平行语料库,包含阿法尔语、阿姆哈拉语、英语、奥罗莫语、索马里语、提格雷尼亚语6种语言的新闻片段平行文本,以及每条文本对应的元数据(如新闻范围、类别、来源等),支持多语言机器翻译研究与系统开发。 文件详解 核心数据文件 目录名称:data/...
    packageimg
  • 哥伦比亚_El_Tiempo_日报单日新闻提取数据_20221111

    2026年1月25日 30 10 1

    数据集概述 本数据集为哥伦比亚《El Tiempo》日报2022年11月11日的新闻提取数据,包含当天该报纸发布的新闻内容,以结构化格式存储,可用于新闻内容分析、媒体研究等场景,数据集仅含一个文件。 文件详解 文件名称:news_eltiempo_11-11-2022.json 文件格式:JSON...
    packageimg
  • CyberSecNews_Based_德英网络安全新闻人工分类标注数据集

    2026年1月21日 30 90 69

    数据集概述 本数据集包含457篇德语和英语新闻文章,通过RSS源从各类新闻网站和博客收集。每篇文章经AIT数字安全与安全中心同事人工分类,标注为“网络安全”“非网络安全”或“不确定”,并提供文章标题、内容、语言、来源、发布时间、版权声明及参与者分类结果等信息,无缺失值。 文件详解 文件名称:cybersec_news_de_en.json...
    packageimg
  • Fake_News_Database_Based_事实核查虚假与真实新闻分类数据

    2026年1月15日 30 154 57

    数据集概述 本数据集为经过整理的事实核查新闻数据库,包含近七万条URL,覆盖虚假与真实新闻内容,并按主题分类。核心内容为事实核查的新闻条目,支持虚假新闻识别与相关研究,总计包含2个文件。 文件详解 readme.txt 文件格式:TXT 内容介绍:数据集说明文档,解释数据库构成及json文件的字段含义。 fake_news_db.json...
    packageimg
  • 新闻信息传播数据集

    2025年12月11日 30 141 39

    数据集概述 该数据集围绕体育(FIFA世界杯)、自然灾害(地震)、气候变化(全球变暖)三大领域的新闻信息传播展开,包含多语言新闻文章及元数据,为研究不同事件的信息传播特征提供支持。 文件详解 核心数据文件(CSV格式): FIFAWorldCup - Metadata.csv:FIFA世界杯事件的元数据文件 Earthquake -...
    packageimg
  • 新闻文本分类数据集-priyabratapanda

    2025年4月23日 60 92 24

    新闻文本分类数据集-priyabratapanda 数据来源:互联网公开数据 标签:新闻,文本分类,机器学习,自然语言处理,NLP,数据集,信息检索,舆情分析 数据概述:该数据集包含来自多种新闻来源的文本数据,用于新闻文本的分类任务。主要特征如下: 时间跨度:数据记录的时间跨度为不固定,涵盖了不同时间段的新闻报道。...
    packageimg
  • 文本分类新闻数据集

    2025年10月11日 30 37 12

    文本分类新闻数据集_Text_Classification_News_Dataset 数据来源:互联网公开数据 标签:文本分类, 新闻, 自然语言处理, 机器学习, 语料库, 分类, 深度学习, 中文 数据概述: 该数据集包含来自新闻网站的文本数据,记录了经过预处理的中文新闻文章,用于文本分类任务。主要特征如下:...
    packageimg
  • 越南新闻文章内容分类数据集

    2025年9月24日 30 176 36

    越南新闻文章内容分类数据集_Vietnam_News_Articles_Content_Classification 数据来源:互联网公开数据 标签:新闻文章, 内容分类, 文本分析, 越南语, 自然语言处理, 机器学习, 时事新闻, 数据集 数据概述:...
    packageimg
  • 中文新闻文本分类数据集_Chinese_News_Text_Classification_Dataset

    2025年6月28日 30 40 12

    中文新闻文本分类数据集_Chinese_News_Text_Classification_Dataset 数据来源:互联网公开数据 标签:文本分类, 新闻, 情感分析, 自然语言处理, 机器学习, 类别识别, 语料库, 中文 数据概述: 该数据集包含来自互联网的新闻文本,记录了不同类别的新闻文章内容,主要用于文本分类任务。主要特征如下:...
    packageimg
  • 中文新闻文本分类数据集_Chinese_News_Text_Classification

    2025年6月25日 30 36 31

    中文新闻文本分类数据集_Chinese_News_Text_Classification 数据来源:互联网公开数据 标签:文本分类, 新闻语料, 自然语言处理, 机器学习, 体育, 财经, 科技, 语料库 数据概述: 该数据集包含来自中文新闻的数据,记录了不同类别的新闻文本内容,主要用于文本分类任务。主要特征如下:...
    packageimg
  • 孟加拉语新闻分类数据集1963-2021

    2025年4月14日 60 92 12

    孟加拉语新闻分类数据集1963-2021 数据来源:互联网公开数据 标签:孟加拉语,新闻分类,NLP,机器学习,文本分析,情感分析,信息检索,语言建模 数据概述: 本数据集收录了来自Jamuna...
    packageimg
  • 新闻广告标签数据集

    2025年6月4日 30 123 77

    新闻广告标签数据集 数据来源:互联网公开数据 标签:新闻分类,文本挖掘,广告标签,自然语言处理,机器学习,数据标注 数据概述: 本数据集包含了一批新闻文章及其对应的IAB(互动广告局)分类标签。数据集的来源为Fibe - Hack the Vibe! 2.0 -...
    packageimg
  • 德国新闻数据集

    2025年6月1日 30 140 137

    德国新闻数据集 数据来源:互联网公开数据 标签:新闻,德国,媒体分析,文本挖掘,时间序列,数据科学,新闻采集,新闻分类 数据概述:...
    packageimg
  • 德国新闻文章内容分类数据集-dirkbahle

    2025年6月1日 30 145 132

    德国新闻文章内容分类数据集-dirkbahle 数据来源:互联网公开数据 标签:德国新闻,新闻文章,文本分析,自然语言处理,内容分类,新闻爬取,文本数据,时事新闻 数据概述:...
    packageimg
  • 泰国文本摘要数据集

    2025年6月1日 30 105 26

    泰国文本摘要数据集 数据来源:互联网公开数据 标签:文本摘要,泰语,新闻分类,摘要生成,自然语言处理,新闻标题,语言建模 数据概述:...
    packageimg
  • 数据2020至2023年俄罗斯新闻分类竞赛数据集-vorvit

    2025年6月1日 30 60 44

    2020至2023年俄罗斯新闻分类竞赛数据集-vorvit 数据来源:互联网公开数据 标签:新闻,分类,机器学习,自然语言处理,NLP,竞赛,ВШЭ,ВШЭ Магистратура,First Step in NLP 数据概述:...
    packageimg
  • 巴西圣保罗报新闻数据集2024年2月前

    2025年6月1日 30 13 6

    巴西圣保罗报新闻数据集2024年2月前 数据来源:互联网公开数据 标签:新闻,巴西,圣保罗报,数据抓取,新闻分类,新闻内容,发布时间 数据概述:...
    packageimg
  • Fibe黑客挑战赛新闻文章分类数据集-2021

    2025年5月31日 30 160 113

    Fibe黑客挑战赛新闻文章分类数据集-2021 数据来源:互联网公开数据 标签:AI挑战赛,新闻文章,文本分类,机器学习,数据处理,深度学习,分类模型 数据概述: 本数据集来源于Fibe举办的“Hack the Vibe! 2.0”...
    packageimg
  • 法尔斯新闻网站新闻文章数据集-2021至2023年

    2025年5月31日 30 25 24

    法尔斯新闻网站新闻文章数据集-2021至2023年 数据来源:互联网公开数据 标签:法尔斯新闻,新闻文章,伊朗,伊朗媒体,新闻分类,新闻时间,文本数据 数据概述: 本数据集包含从法尔斯新闻网站(Tabnak)抓取的新闻文章数据,涵盖了2021年至2023年期间发布的文章。数据集包括新闻标题、文章正文、分类标签和发布时间等核心字段。字段定义如下:...
    packageimg
  • 德国新闻文章分类数据集-2011-abhishek

    2025年5月31日 30 37 28

    德国新闻文章分类数据集-2011-abhishek 数据来源:互联网公开数据 标签:新闻文章,分类,德语,文本分析,自然语言处理,学术研究,工业应用 数据概述: 本数据集包含10,000篇德语新闻文章,适用于主题分类研究。数据来源于Dietmar Schabus, Marcin Skowron和Martin Trapp于2017年在ACM...
    packageimg