Kleptotrace_Based_金融腐败实体抽取微型基准数据集

数据集概述

本数据集为微型基准数据集,包含15篇聚焦金融腐败主题的文章(共441句),以及文章中提及的个人和组织列表各1份,用于评估基于大语言模型的实体抽取流程。

文件详解

  • 文件名称:Dataset-org.json
  • 文件格式:JSON
  • 字段映射介绍:包含金融腐败主题文章的文本内容,以及从中提取的个人列表和组织列表两类实体信息

数据来源

论文“Entity Extraction from High-Level Corruption Schemes via Large Language Models”(BDA4FCT@IEEE Big Data 2024)及arXiv论文(https://arxiv.org/abs/2409.13704

适用场景

  • 实体抽取模型评估: 用于测试和验证金融腐败文本中个人、组织实体的抽取算法性能
  • 金融腐败文本分析: 研究金融腐败主题文本的实体分布特征与关联关系
  • 大语言模型应用测试: 验证大语言模型在专业领域(金融腐败)实体抽取任务中的效果
  • 腐败研究数据支撑: 为金融腐败相关的学术研究提供结构化实体数据基础
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.08 MiB
最后更新 2026年1月27日
创建于 2026年1月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。