数据集概述
本数据集包含巴西CNPq研究小组目录中标题含“数字人文”的研究小组成员的科研产出报告,涵盖成员信息、发表成果及合作关系分析数据,包括HTML报告、可视化图表、合作网络图谱文件及结构化数据表格等多种类型文件。
文件详解
该数据集包含多种格式的文件,具体说明如下:
- HTML报告文件(68个):如index.html、Ep-2.html等,占比约50.75%,可能为科研产出的结构化报告页面。
- 图片文件(47个):如OA.png、lattesPoint0.png等,占比约35.07%,可能为科研产出的可视化图表或标识图片。
- 文本文件(10个):如teste-02-authorRank.txt(含数值型排名数据)、teste-02-listaDeNomes.txt(成员名单)、teste-02-matrizDeFrequenciaNormalizada.txt(归一化频率矩阵)等,存储实验测试相关的数值或列表数据。
- 合作网络图谱文件:grafoDeColaboracoesSemPesos.dot(无权重合作图谱)、grafoDeColaboracoesComPesos.dot(有权重合作图谱)、grafoDeColaboracoesNormalizado.dot(归一化合作图谱)、teste-02-rede.gdf(网络数据文件),用于展示成员合作关系。
- RIS文献文件:teste-02-membros.ris(成员文献)、teste-02-publicacoes.ris(发表文献),存储标准化的文献引用数据。
- CSV表格文件:teste-02-publicacoesDoGrupo.csv(小组发表成果)、teste-02-publicacoesPorMembro.csv(成员发表成果),存储结构化的科研产出统计数据。
- 样式文件:scriptLattes.css,用于HTML报告的样式渲染。
适用场景
- 科研合作网络分析:基于合作图谱文件研究数字人文领域研究小组的成员合作模式与网络结构。
- 科研产出计量研究:通过CSV表格文件分析小组及成员的科研产出数量与分布特征。
- 数字人文领域科研趋势研究:整合多类型文件数据,探索数字人文研究小组的研究方向与成果产出规律。
- 科研管理支持:为科研管理部门评估数字人文研究小组的科研活跃度与合作强度提供数据支撑。
- 信息可视化研究:基于图片文件与图谱文件,探索科研数据可视化的呈现方式与效果。