数据集

数据20Newsgroup_Based_机器学习解释评估人工标注词权重数据

数据集概述

本数据集是论文“Quantitative Evaluation of Machine Learning Explanations: A Human-Grounded Benchmark”所用数据的子集，包含20Newsgroup数据集中文档的词汇，这些词汇基于标注人员对每篇文本文章的选择进行了权重赋值，同时包含JSON格式的文本样本人工注意力掩码。

文件详解

文件名称：20newsgroup.zip
文件格式：ZIP
字段映射介绍：压缩包内包含基于人工标注的20Newsgroup文档词汇权重数据，以及JSON格式的文本样本人工注意力掩码文件，具体字段需解压后查看内部文件结构。

数据来源

论文“Quantitative Evaluation of Machine Learning Explanations: A Human-Grounded Benchmark”

适用场景

机器学习解释评估研究: 用于量化评估机器学模型解释的合理性，验证模型解释与人类注意力的一致性。
自然语言处理模型优化: 基于人工标注的词权重数据，优化文本分类、文本理解等NLP模型的注意力机制。
可解释人工智能研究: 为可解释AI领域提供人类标注的基准数据，支持解释方法的开发与验证。
文本注意力机制分析: 利用人工注意力掩码数据，研究人类对文本关键信息的关注模式与机器模型的差异。

数据与资源

7771892.zipZIP
0.28 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	0.28 MiB
最后更新	2026年1月21日
创建于	2026年1月21日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。