-
Kremlin_Based_俄罗斯政府网站爬取总统讲话记录_1999_2019
2026年1月19日 30 119 84
数据集概述 本数据集为1999年12月31日至2019年12月31日期间从俄罗斯政府网站kremlin.ru爬取的文档集合,包含10,723份文档,覆盖总统讲话记录等内容,支持政府信息研究与文档分析。 文件详解 主要数据文件 文件名称:Kremlin.json、Kremlin.rds 文件格式:JSON、RDS...
-
MID_Based_俄罗斯外交部2003_2019年新闻文件集合数据
2026年1月25日 30 206 41
数据集概述 本数据集为从俄罗斯外交部官网mid.ru抓取的2003年1月至2019年12月的新闻文件集合,包含部长讲话、副部长讲话、电话交谈、简报会等七类文件,共一万一千八百五十七份文档,每份文档对应一行数据,记录了文档的标识、日期、标题、类型、全文、来源链接等信息。 文件详解 数据文件 文件名称:MID.rds 文件格式:RDS...
-
REVERINO_Based_中世纪教宗文献摘要与全文配对数据_训练基准
2026年1月22日 30 179 65
数据集概述 本数据集包含四千五百三十三对拉丁regesta(摘要)与对应的中世纪教宗文献全文,源自MGH和Auvray两个历史文献集,覆盖1216至1268年教宗文献。数据支持拉丁文本摘要研究与大语言模型自动摘要工具开发,可作为大语言模型处理中世纪拉丁文本的性能评估基准。 文件详解 数据文件(共9个)...
-
RE4GREEN_Task1_4_Based_研究伦理与诚信指南目录数据集
2026年1月21日 30 7 1
数据集概述 本数据集收录了RE4GREEN项目Task 1.4分析中符合纳入标准的213项研究伦理(RE)与研究诚信(RI)指南及框架,覆盖不同地理区域、学科和目标受众,包含文档标题、作者、出版年份、类型、地理适用性等元数据,旨在评估指南中环境与气候伦理考量对科研创新绿色转型的支持作用。 文件详解...



