数据集

Kleptotrace_Based_金融腐败实体抽取微型基准数据集

数据集概述

本数据集为微型基准数据集，包含15篇聚焦金融腐败主题的文章（共441句），以及文章中提及的个人和组织列表各1份，用于评估基于大语言模型的实体抽取流程。

文件详解

文件名称：Dataset-org.json
文件格式：JSON
字段映射介绍：包含金融腐败主题文章的文本内容，以及从中提取的个人列表和组织列表两类实体信息

数据来源

论文“Entity Extraction from High-Level Corruption Schemes via Large Language Models”（BDA4FCT@IEEE Big Data 2024）及arXiv论文（https://arxiv.org/abs/2409.13704）

适用场景

实体抽取模型评估: 用于测试和验证金融腐败文本中个人、组织实体的抽取算法性能
金融腐败文本分析: 研究金融腐败主题文本的实体分布特征与关联关系
大语言模型应用测试: 验证大语言模型在专业领域（金融腐败）实体抽取任务中的效果
腐败研究数据支撑: 为金融腐败相关的学术研究提供结构化实体数据基础

数据与资源

14027005.zipZIP
0.08 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	0.08 MiB
最后更新	2026年1月27日
创建于	2026年1月27日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。