找到202个数据集

标签: 新闻文本

过滤结果
  • 英国广播公司BBC2017年新闻文章文本数据集-aggle6666

    2025年4月23日   

    英国广播公司BBC2017年新闻文章文本数据集-aggle6666 数据来源:互联网公开数据 标签:新闻文章,BBC,文本数据,自然语言处理,NLP,文本挖掘,新闻,2017年,英国,媒体 数据概述: 本数据集包含了2017年从英国广播公司(BBC)新闻网站抓取的新闻文章。数据集提供了大量文本数据,涵盖了广泛的新闻主题。 数据用途概述:...
    packageimg
  • 英国广播公司新闻文本数据集BBCNewsTextDataset-avishi

    2025年4月23日   

    英国广播公司新闻文本数据集BBCNewsTextDataset-avishi 数据来源:互联网公开数据 标签:新闻,文本,数据集,自然语言处理,文本分类,机器学习,新闻报道,舆情分析 数据概述: 该数据集包含来自英国广播公司(BBC)的新闻文章文本数据,用于文本分类和自然语言处理任务。主要特征如下:...
    packageimg
  • 路透社新闻多标签分类数据集-新闻文本-1987年-narendrageek

    2025年4月23日   

    路透社新闻多标签分类数据集-新闻文本-1987年-narendrageek 数据来源:互联网公开数据 标签:新闻文本,多标签分类,文本分类,路透社,机器学习,自然语言处理,主题分类 数据概述:...
    packageimg
  • BBC新闻自然语言处理与词云数据集BBCNewsNLPandWordcloudDataset-esrabicakci

    2025年4月23日   

    BBC新闻自然语言处理与词云数据集BBCNewsNLPandWordcloudDataset-esrabicakci 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,词云,文本分析,信息提取,新闻研究,学术资源...
    packageimg
  • 基特韦新闻语言模型数据集KitweNewsLLMDataset-kavinnan

    2025年4月22日   

    基特韦新闻语言模型数据集KitweNewsLLMDataset-kavinnan 数据来源:互联网公开数据 标签:新闻,语言模型,数据集,自然语言处理,机器学习,文本分析,信息提取,非洲研究 数据概述:该数据集包含来自赞比亚基特韦地区新闻媒体的文本数据,记录了该地区最新的新闻报道和事件。主要特征如下:...
    packageimg
  • 孟加拉语新闻数据集

    2025年4月22日   

    孟加拉语新闻数据集 数据来源:互联网公开数据 标签:新闻文本,孟加拉语,文本分类,文本摘要,自然语言处理 数据概述:...
    packageimg
  • 旧报纸印地语数据集

    2025年4月21日   

    旧报纸印地语数据集 数据来源:互联网公开数据 标签:旧报纸,印地语,新闻文本,数据清洗,自然语言处理,历史文献,文本分析 数据概述: 本数据集是基于 Kaggle 平台上提供的旧报纸数据集(https://www.kaggle.com/alvations/old-...
    packageimg
  • 新闻分类与可信度评估数据集2023-sunny71p

    2025年4月21日   

    新闻分类与可信度评估数据集2023-sunny71p 数据来源:互联网公开数据 标签:新闻分类,假新闻检测,可信度评估,新闻文本,信息真实性,自然语言处理,数据科学 数据概述:...
    packageimg
  • 虚假新闻识别文本数据集

    2025年4月21日   

    虚假新闻识别文本数据集 数据来源:互联网公开数据 标签:虚假新闻,新闻文本,自然语言处理,文本分类,机器学习,舆情分析,新闻真伪,网络安全 数据概述: 本数据集来源于《机器学习在网络安全中的应用》一书的第四章,包含了虚假新闻和真实新闻文章的集合。数据集旨在为研究人员和实践者提供一个用于虚假新闻检测和分析的资源。 数据用途概述:...
    packageimg
  • 巴西ATribuna报纸新闻文本分类数据集

    2025年4月19日   

    巴西ATribuna报纸新闻文本分类数据集 数据来源:互联网公开数据 标签:新闻文本,分类,巴西,报纸,文本挖掘,机器学习,自然语言处理 数据概述: 本数据集源自巴西报纸“A...
    packageimg
  • 文本情感分析研究数据集-社交媒体评论与新闻文本-通用

    2025年4月19日   

    文本情感分析研究数据集-社交媒体评论与新闻文本-通用 数据来源:互联网公开数据 标签:情感分析,自然语言处理,文本挖掘,社交媒体,新闻文本,情感分类,观点挖掘,机器学习 数据概述:...
    packageimg
  • 日本报纸新闻数据集

    2025年4月16日   

    日本报纸新闻数据集 数据来源:互联网公开数据 标签:日本媒体,新闻文本,时间序列,多语言 corpus,新闻分析,文本挖掘,语言研究 数据概述: 本数据集收录了2005年7月至2021年10月期间日本主流报纸网站及历史报纸 dataset...
    packageimg
  • 世界新闻热点文章文本情感分析数据集2023

    2025年4月15日   

    世界新闻热点文章文本情感分析数据集2023 数据来源:互联网公开数据 标签:世界新闻,情感分析,Reddit,新闻文本,自然语言处理,数据清洗,实体识别 数据概述: 本数据集包含了从Reddit的r/worldnews板块抓取的热门文章文本,时间范围截至2023年。数据集通过PushShift...
    packageimg
  • 泰米尔语新闻数据集

    2025年4月15日   

    泰米尔语新闻数据集 数据来源:互联网公开数据 标签:泰米尔语,新闻,文本分类,数据集,印度语言,自然语言处理,基准测试 数据概述:...
    packageimg
  • 阿拉伯文新闻文本摘要数据集

    2025年4月15日   

    阿拉伯文新闻文本摘要数据集 数据来源:互联网公开数据 标签:阿拉伯语,新闻文本,文本摘要,数据集,自然语言处理,文本分类,机器学习 数据概述:...
    packageimg
  • 英国广播公司BBC新闻文章文本数据集

    2025年4月15日   

    英国广播公司BBC新闻文章文本数据集 数据来源:互联网公开数据 标签:新闻文章,文本数据,BBC,媒体,内容分析,自然语言处理,文本挖掘,英国 数据概述: 本数据集包含英国广播公司(BBC)发布的新闻文章文本内容。数据以CSV格式存储,原始数据为TXT格式。数据集涵盖了BBC新闻文章的标题、正文以及可能包含的发布日期、所属类别等元数据。 数据用途概述:...
    packageimg
  • 英国脱欧媒体舆论新闻文本数据集2016-2023

    2025年4月15日   

    英国脱欧媒体舆论新闻文本数据集2016-2023 数据来源:互联网公开数据 标签:英国脱欧,媒体舆论,文本分析,自然语言处理,新闻文本,舆论演变,主题建模 数据概述:...
    packageimg
  • 网络欺诈新闻分类数据集

    2025年4月15日   

    网络欺诈新闻分类数据集 数据来源:互联网公开数据 标签:网络欺诈,新闻分类,金融诈骗,网络安全,数据分析,机器学习,新闻文本 数据概述: 该数据集旨在帮助分类与金融欺诈相关的新闻文章,将其分为网络欺诈(cyber)和非网络欺诈(non-cyber)两类。数据集包含两个CSV文件:cyber.csv 和 noncyber.csv。cyber.csv...
    packageimg
  • BBC印地语新闻文章数据集

    2025年4月14日   

    BBC印地语新闻文章数据集 数据来源:互联网公开数据 标签:印地语新闻,新闻文本,自然语言处理,NLP,情感分析,语言模型,新闻分类 数据概述: 本数据集包含通过Python网络爬虫技术从BBC印地语新闻网站采集的大量新闻文章,涵盖了多个新闻类别。每个新闻条目包含以下三个核心字段: 标题(Headline):新闻文章的标题,用于概括新闻的主要内容。...
    packageimg
  • 土耳其新闻文本数据集

    2025年4月14日   

    土耳其新闻文本数据集 数据来源:互联网公开数据 标签:土耳其新闻,文本分析,新闻分类,文化,艺术,经济,世界新闻,汽车,体育,技术,杂志 数据概述:...
    packageimg