数据集概述
该数据集为一项研究的复现数据,研究构建了基于大语言模型(LLM)的自动化框架,评估三十三个国家最高审计机关(SAIs)的绩效审计报告对ISSAI3000标准的遵循情况,包含标准文本、报告文件及分析结果。
文件详解
- 文件名称:SAI_reports_and_ISSAI3000_standards.zip
- 文件格式:ZIP压缩包
- 内容:含三十四个文件夹,三十三个国家各一个(每个含五份PDF格式SAI报告及对应文本文件),一个含ISSAI3000标准PDF和文本文件的文件夹
- 文件名称:sai_analysis_results.pkl
- 文件格式:Python PKL文件
- 内容:Python字典结构,包含analyzed_reports(分析报告列表)、report_summary(报告英文摘要)、report_rating(含国家、日期、语言、审计机构及各标准评估结果的字典列表)、skipped_reports(因长度超限跳过的报告列表)
- 文件名称:prompts_and_additional_data.pdf
- 文件格式:PDF
- 内容:含多个附录,附录一为思维链提示的系统提示词和四个用户提示词,其他附录为研究补充数据
适用场景
- 审计标准遵循性研究:分析不同国家SAI绩效审计报告对ISSAI3000标准的遵循程度
- 大语言模型应用研究:探究LLM结合思维链提示在文本合规性评估中的效果
- 审计制度比较分析:基于报告数据比较不同国家审计实践与国际标准的差异
- 研究复现支持:为相关学术研究提供可复现的原始数据和分析结果