数据集概述
本数据集为RSEF(RepoFromPaper)在非计算机科学论文上的输出结果,包含双向和单向仓库链接搜索的实验数据。实验基于2023/24年发表于arXiv定量生物学和天体物理学领域的2000篇论文,记录论文DOI及对应的仓库链接搜索结果,共2个文件。
文件详解
- 文件名称:noncs_dois.txt
- 文件格式:TXT
- 字段映射介绍:包含实验所用的2000篇非计算机科学论文的DOI列表,每条DOI为论文的唯一标识符,格式为标准DOI编号(如10.1371/journal.pone.0166456)。
- 文件名称:rsef_noncs_output.json
- 文件格式:JSON
- 字段映射介绍:包含RSEF双向和单向仓库链接搜索的输出结果,记录论文DOI与对应仓库链接的匹配信息(具体字段基于RSEF工具输出结构,未提供详细字段映射)。
数据来源
arXiv.org(定量生物学和天体物理学板块2023/24年发表的论文)
适用场景
- 学术论文与代码仓库关联研究:分析非计算机科学论文与开源代码仓库的链接关系,探索跨学科代码复用情况。
- 论文数据挖掘:基于DOI列表扩展论文元数据,支持学术影响力、研究趋势等分析。
- 开源工具效果评估:验证RSEF工具在非计算机科学领域的仓库链接搜索准确率和覆盖率。
- 跨学科研究资源整合:为定量生物学、天体物理学领域的研究人员提供论文对应的代码仓库资源索引。