希伯来维基百科文章质量分类数据集-matankic

希伯来维基百科文章质量分类数据集-matankic 数据来源:互联网公开数据 标签:维基百科,希伯来语,文章质量,分类,数据集,Google Colab

数据概述: 本数据集收录了希伯来维基百科中文章的质量分类信息,数据来源于Google Colab上的Quality Groups of Hebrew Wikipedia Articles notebook。文章质量被分为三个等级: 0 -> 低质量文章(תבנית לשכתב) 1 -> 普通文章 2 -> 特优文章(ערכים מומלצים)

数据集包含了每篇文章的标题、URL以及对应的质量评分,适用于分析希伯来维基百科的文章质量分布和分类标准。

数据用途概述: 该数据集适用于维基百科内容质量分析、语言学研究、信息检索等多种场景。研究人员可以利用此数据评估维基百科文章的整体质量和改进方向;语言学家可以借此研究希伯来语维基百科的内容结构和语言特点;信息检索学者则可以利用数据优化搜索引擎的检索算法。对于维基百科的维护者和编辑者而言,该数据集也是提升内容质量的重要参考。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 82.76 MiB
最后更新 2025年5月31日
创建于 2025年5月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。