找到157个数据集

分类: 互联网数据 标签: 维基百科

过滤结果
  • 维基百科页面浏览量预测数据集

    2025年8月30日 30 9 1

    维基百科页面浏览量预测数据集_Wikipedia_Page_Views_Prediction 数据来源:互联网公开数据 标签:维基百科, 页面浏览量, 时间序列分析, 预测, 数据挖掘, 自然语言处理, 统计分析, 机器学习 数据概述: 该数据集包含来自维基百科的页面浏览量数据,记录了不同维基百科页面在特定时间段内的访问量。主要特征如下:...
    packageimg
  • 中文维基百科2019年文本数据集

    2025年8月25日 30 28 19

    中文维基百科2019年文本数据集_Chinese_Wikipedia_2019_Text_Dataset 数据来源:互联网公开数据 标签:维基百科, 中文, 文本数据, 自然语言处理, 语料库, 文本分析, 语言模型, 知识图谱 数据概述: 该数据集包含来自2019年中文维基百科的文本数据,记录了维基百科上各种主题的中文文章内容。主要特征如下:...
    packageimg
  • 维基百科知识图谱数据集Wiki-DataKnowledgeGraphDataset-berkayozturkx

    2025年4月26日 30 57 5

    维基百科知识图谱数据集Wiki-DataKnowledgeGraphDataset-berkayozturkx 数据来源:互联网公开数据 标签:知识图谱,维基百科,数据集,语义网络,数据挖掘,自然语言处理,人工智能,信息检索 数据概述: 该数据集包含来自维基百科的知识图谱数据,记录了维基百科中实体的属性和关系。主要特征如下:...
    packageimg
  • 知识图谱实体关系数据集

    2025年8月13日 30 151 111

    知识图谱实体关系数据集_Knowledge_Graph_Entity_Relation_Dataset 数据来源:互联网公开数据 标签:知识图谱, 实体识别, 关系抽取, 语义分析, 数据挖掘, 自然语言处理, 维基百科, 知识表示 数据概述: 该数据集包含从维基百科提取的知识图谱相关数据,记录了实体、属性、关系等信息。主要特征如下:...
    packageimg
  • 多语言维基百科文章翻译质量评估数据集

    2025年8月11日 30 186 27

    多语言维基百科文章翻译质量评估数据集_Multilingual_Wikipedia_Article_Translation_Quality_Assessment 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 语言模型, 文本质量评估, 多语言, 维基百科, 数据标注, 自然语言处理 数据概述:...
    packageimg
  • 维基百科评论毒性分类数据集

    2025年7月16日 30 68 49

    维基百科评论毒性分类数据集_Wikipedia_Comments_Toxicity_Classification 数据来源:互联网公开数据 标签:毒性检测, 文本分类, 自然语言处理, 情感分析, 机器学习, 维基百科, 评论分析, 深度学习 数据概述: 该数据集包含来自维基百科的评论文本,记录了不同评论的毒性程度。主要特征如下:...
    packageimg
  • STEM领域维基百科语料库数据集

    2025年6月4日 30 180 48

    STEM领域维基百科语料库数据集 数据来源:互联网公开数据 标签:STEM,维基百科,语料库,文本处理,自然语言处理,科学教育,知识图谱,数据分析 数据概述:...
    packageimg
  • 维基百科主题与类别数据集

    2025年6月1日 30 154 68

    维基百科主题与类别数据集 数据来源:互联网公开数据 标签:维基百科,主题标签,类别分类,NLP,文本分析,数据挖掘,知识图谱,元数据,语义分析 数据概述: 本数据集基于维基百科页面标题及其分类信息,包含超过2300万个主题及其相关类别。每个主题(如“Anarchism”)都附带丰富的元数据,包括所属类别(如“Political...
    packageimg
  • 维基百科人物内容数据集

    2025年6月1日 30 60 56

    维基百科人物内容数据集 数据来源:互联网公开数据 标签:维基百科,人物,内容分析,文本挖掘,知识图谱,自然语言处理,数据分析 数据概述:...
    packageimg
  • 维基百科推广文章数据集

    2025年6月1日 30 104 52

    维基百科推广文章数据集 数据来源:互联网公开数据 标签:推广文章,维基百科,文本分类,内容分析,数据挖掘,信息质量,自然语言处理 数据概述: 本数据集包含两类文章:一类是被用户标记为“具有推广性语气”的文章(promotional.csv),另一类是被评估为“优质文章”的文章(good.csv)。 - 每篇推广性文章可能带有多个标签,包括但不限于: -...
    packageimg
  • 维基百科-事物-主题相关页面数据分析数据集

    2025年6月1日 30 83 8

    维基百科-事物-主题相关页面数据分析数据集 数据来源:互联网公开数据 标签:维基百科,事物,知识图谱,文本分析,自然语言处理,主题分类,信息检索 数据概述:...
    packageimg
  • 维基百科句子拆分数据集-2023-thedevastator

    2025年5月31日 30 101 66

    维基百科句子拆分数据集-2023-thedevastator 数据来源:互联网公开数据 标签:维基百科,句子拆分,NLP,自然语言处理,文本分析,数据集,机器学习 数据概述:...
    packageimg
  • 维基百科标题多语言翻译数据集

    2025年5月31日 30 45 4

    维基百科标题多语言翻译数据集 数据来源:互联网公开数据 标签:维基百科,平行术语库,多语言翻译,印度语言,数据共享,自然语言处理 数据概述:...
    packageimg
  • 希伯来维基百科文章质量分类数据集-matankic

    2025年5月31日 30 90 66

    希伯来维基百科文章质量分类数据集-matankic 数据来源:互联网公开数据 标签:维基百科,希伯来语,文章质量,分类,数据集,Google Colab 数据概述: 本数据集收录了希伯来维基百科中文章的质量分类信息,数据来源于Google Colab上的Quality Groups of Hebrew Wikipedia Articles...
    packageimg
  • 维基百科页面未来流量预测数据集-tommyngx

    2025年5月31日 30 210 188

    维基百科页面未来流量预测数据集-tommyngx 数据来源:互联网公开数据 标签:维基百科,流量预测,时间序列,页面浏览量,机器学习,数据分析,预测模型 数据概述:...
    packageimg
  • 加利西亚维基百科页面修订与编辑数据集

    2025年5月31日 30 94 93

    加利西亚维基百科页面修订与编辑数据集 数据来源:互联网公开数据 标签:维基百科,加利西亚语,编辑行为,内容分析,修订历史,用户贡献,群体动态 数据概述:...
    packageimg
  • 维基百科2018-2019年网页流量数据集-sandeshbhat

    2025年5月31日 30 123 82

    维基百科2018-2019年网页流量数据集-sandeshbhat 数据来源:互联网公开数据 标签:维基百科,网页流量,时间序列,数据分析,预测,机器学习,多语言,数据科学,ARIMA,Prophet 数据概述:...
    packageimg
  • 维基百科页面浏览量时间序列数据集WikipediaPageviewTimeSeries-bigbang1s

    2025年5月31日 30 206 117

    维基百科页面浏览量时间序列数据集WikipediaPageviewTimeSeries-bigbang1s 数据来源:互联网公开数据 标签:维基百科, 页面浏览量, 时间序列, 数据分析, 预测模型, 流量分析, 趋势分析, 统计学 数据概述: 该数据集包含来自维基百科的页面浏览量数据,记录了特定页面在一段时间内的每日浏览量。主要特征如下:...
    packageimg
  • 维基百科评论区毒性文本分类数据集WikipediaCommentToxicityClassificationDataset-vineetkumar98

    2025年5月31日 30 202 44

    维基百科评论区毒性文本分类数据集WikipediaCommentToxicityClassificationDataset-vineetkumar98 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 情感分析, 自然语言处理, 恶意评论, 维基百科, 机器学习, 语料库 数据概述:...
    packageimg
  • 维基百科页面浏览量时间序列数据集WikipediaPageviewTimeSeries-leisinidan

    2025年5月31日 30 68 44

    维基百科页面浏览量时间序列数据集WikipediaPageviewTimeSeries-leisinidan 数据来源:互联网公开数据 标签:维基百科, 页面浏览量, 时间序列分析, 数据挖掘, 流量预测, 趋势分析, 统计分析, 数据可视化 数据概述:...
    packageimg