Papers_With_Code_Based_软件提及语料库数据

数据集概述

本数据集是从Papers With Code平台下载的出版物列表中构建的软件提及语料库,通过筛选包含GitHub仓库元数据的论文文本生成。数据集仅包含一个压缩文件,未划分训练/测试集、数据/标签集或原始/处理集,文件类型单一。

文件详解

  • 文件名称:papers_with_code_corpus.zip
  • 文件格式:ZIP(压缩包)
  • 内容说明:压缩包内包含从Papers With Code平台出版物中提取的软件提及相关文本数据,具体字段及内部文件结构未通过预览披露。

数据来源

Papers With Code平台

适用场景

  • 学术论文软件引用分析: 研究学术论文中软件工具的提及频率、分布特征及关联研究主题。
  • 开源软件影响力评估: 分析GitHub仓库在学术领域的应用场景和学术认可度。
  • 文本挖掘模型训练: 作为NLP任务(如软件实体识别、关系抽取)的语料库资源。
  • 科研工具生态研究: 探索计算机科学领域中软件工具的学术传播路径与协作网络。
packageimg

数据与资源

该数据集没有数据

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.0 MiB
最后更新 2026年2月12日
创建于 2026年2月12日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。