找到376个数据集

标签: 新闻

过滤结果
  • 推特印度社交媒体网红数据库及注释说明

    2026年2月15日 30 26 24

    数据集概述 本数据集为印度Twitter平台上的高影响力用户数据库,通过种子账户好友网络迭代扩展、手动验证及分类标注构建,涵盖娱乐、体育、商业、政府等多领域共11580个独特账户,支持社交媒体叙事与影响力相关研究。 文件详解 文件名称:influencers_final.xlsx 文件格式:XLSX...
    packageimg
  • Wikicite_Multilingual_Based_多语言维基百科分类引用数据集2024

    2026年1月17日 30 151 18

    数据集概述 本数据集是从2024年2月多语言维基百科数据转储中提取的翻译引用数据集,包含德语、法语、俄语等十二种语言的分类引用信息。通过统一的提取和模板协调流程,将各语言引用模板转换为通用英文模板,并按新闻、书籍、期刊或其他类型分类,仅统计包含DOI、PMID、PMC和ISBN标识符的引用,为学术引用分析提供结构化数据支持。 文件详解...
    packageimg
  • 科学社会互联价值创造模型组件与原型数据集

    2025年12月14日 30 112 83

    数据集概述 本数据集是研究《科学社会互联的价值创造模型:组件与原型》的配套资料,包含论文支撑信息、研究主题标题文本及原型分析结构化数据,为探索科学领域与社会互联的价值创造模式提供数据支持。 文件详解 文件名称: supplement_information.pdf 文件格式: PDF 内容说明:...
    packageimg
  • 新闻文本分类数据集-priyabratapanda

    2025年4月23日 60 84 49

    新闻文本分类数据集-priyabratapanda 数据来源:互联网公开数据 标签:新闻,文本分类,机器学习,自然语言处理,NLP,数据集,信息检索,舆情分析 数据概述:该数据集包含来自多种新闻来源的文本数据,用于新闻文本的分类任务。主要特征如下: 时间跨度:数据记录的时间跨度为不固定,涵盖了不同时间段的新闻报道。...
    packageimg
  • 文本分类新闻数据集

    2025年10月11日 30 115 77

    文本分类新闻数据集_Text_Classification_News_Dataset 数据来源:互联网公开数据 标签:文本分类, 新闻, 自然语言处理, 机器学习, 语料库, 分类, 深度学习, 中文 数据概述: 该数据集包含来自新闻网站的文本数据,记录了经过预处理的中文新闻文章,用于文本分类任务。主要特征如下:...
    packageimg
  • 俄罗斯新闻文本情感分析数据集

    2025年8月23日 30 96 87

    俄罗斯新闻文本情感分析数据集_Russian_News_Text_Sentiment_Analysis 数据来源:互联网公开数据 标签:情感分析, 文本挖掘, 俄语, 新闻, 自然语言处理, 情感分类, 文本语料, 情绪识别 数据概述: 该数据集包含来自俄罗斯新闻网站的数据,记录了新闻文章的文本内容,用于情感分析任务。主要特征如下:...
    packageimg
  • 俄语新闻文本关键词提取数据集

    2025年7月27日 30 45 21

    俄语新闻文本关键词提取数据集_Russian_News_Text_Keyword_Extraction_Dataset 数据来源:互联网公开数据 标签:文本分析, 关键词提取, 自然语言处理, 俄语, 新闻, 文本挖掘, 语料库, 信息检索 数据概述: 该数据集包含来自俄罗斯新闻网站的文章文本数据,主要用于关键词提取和文本分析任务。主要特征如下:...
    packageimg
  • 中文新闻文本分类数据集_Chinese_News_Text_Classification_Dataset

    2025年6月28日 30 194 58

    中文新闻文本分类数据集_Chinese_News_Text_Classification_Dataset 数据来源:互联网公开数据 标签:文本分类, 新闻, 情感分析, 自然语言处理, 机器学习, 类别识别, 语料库, 中文 数据概述: 该数据集包含来自互联网的新闻文本,记录了不同类别的新闻文章内容,主要用于文本分类任务。主要特征如下:...
    packageimg
  • 新闻文本分类与嵌入数据集_News_Text_Classification_and_Embedding_Dataset

    2025年6月25日 30 68 67

    新闻文本分类与嵌入数据集_News_Text_Classification_and_Embedding_Dataset 数据来源:互联网公开数据 标签:文本分类, 新闻, 自然语言处理, 嵌入, 多分类, 机器学习, 情感分析, 类别预测 数据概述:...
    packageimg
  • 越南新闻网站时事新闻抓取数据集ZingNews-Tuoitre-CafeF-2024

    2025年6月4日 30 206 155

    越南新闻网站时事新闻抓取数据集ZingNews-Tuoitre-CafeF-2024 数据来源:互联网公开数据 标签:越南,新闻,时事,ZingNews,Tuoitre,CafeF,数据抓取,舆情分析,新闻报道 数据概述:...
    packageimg
  • 电影及其相关新闻数据集

    2025年6月4日 30 102 49

    电影及其相关新闻数据集 数据来源:互联网公开数据 标签:电影,新闻,行业动态,市场分析,观众行为,票房数据,娱乐产业 数据概述:...
    packageimg
  • 全球新闻周报数据集

    2025年6月1日 30 152 144

    全球新闻周报数据集 数据来源:互联网公开数据 标签:新闻,时间序列,多语言,媒体分析,新闻源,内容聚合,新闻事件,全球新闻 数据概述:...
    packageimg
  • 德国新闻数据集

    2025年6月1日 30 30 19

    德国新闻数据集 数据来源:互联网公开数据 标签:新闻,德国,媒体分析,文本挖掘,时间序列,数据科学,新闻采集,新闻分类 数据概述:...
    packageimg
  • 新闻主题预测数据集

    2025年6月1日 30 93 56

    新闻主题预测数据集 数据来源:互联网公开数据 标签:新闻,主题预测,体育,文化,经济,时间序列,文本分析 数据概述: 本数据集收录了2019年至2023年间来自俄罗斯新闻网站lenta.ru的新闻数据,涵盖体育、文化、经济等多个领域。数据集包含新闻标题、正文内容、发布时间及主题标签等字段,为新闻主题预测任务提供了高质量的数据支持。 数据用途概述:...
    packageimg
  • 美国资本市场新闻头条数据集2020至2024年-addarm

    2025年6月1日 30 39 14

    美国资本市场新闻头条数据集2020至2024年-addarm 数据来源:互联网公开数据 标签:美国,资本市场,新闻,金融市场,经济,数据分析,投资,股市,新闻头条 数据概述: 本数据集收录了2020年至2024年间美国资本市场相关的新闻头条。数据来自CityFALCON, Invezz和Kwhen,并由IEX...
    packageimg
  • 数据2020至2023年俄罗斯新闻分类竞赛数据集-vorvit

    2025年6月1日 30 171 72

    2020至2023年俄罗斯新闻分类竞赛数据集-vorvit 数据来源:互联网公开数据 标签:新闻,分类,机器学习,自然语言处理,NLP,竞赛,ВШЭ,ВШЭ Магистратура,First Step in NLP 数据概述:...
    packageimg
  • 巴西圣保罗报新闻数据集2024年2月前

    2025年6月1日 30 88 50

    巴西圣保罗报新闻数据集2024年2月前 数据来源:互联网公开数据 标签:新闻,巴西,圣保罗报,数据抓取,新闻分类,新闻内容,发布时间 数据概述:...
    packageimg
  • 纽约时报文章内容分析精简版数据集-2007-2017

    2025年6月1日 30 138 23

    纽约时报文章内容分析精简版数据集-2007-2017 数据来源:互联网公开数据 标签:纽约时报,文章,新闻,文本分析,聚类,主题建模,情感分析 数据概述:...
    packageimg
  • Coursera数据科学专项课程数据集-文本内容分析-英语语料库

    2025年6月1日 30 148 45

    Coursera数据科学专项课程数据集-文本内容分析-英语语料库 数据来源:互联网公开数据 标签:自然语言处理,文本分析,机器学习,语料库,Coursera,博客,新闻,推特,英语,数据科学 数据概述: 本数据集是Coursera数据科学专项课程的Capstone项目所使用的数据集,其语料库来源于HC...
    packageimg
  • 全球RSS新闻数据集

    2025年6月1日 30 60 19

    全球RSS新闻数据集 数据来源:互联网公开数据 标签:RSS,新闻,内容聚合,文本分析,数据挖掘,机器学习 数据概述:...
    packageimg