数据集

False_Authorship_Methods_and_materials_虚假作者归属研究数据包

数据集概述

本数据集为虚假作者归属研究的方法与材料数据包，包含Python、shell、awk脚本及相关数据，用于生成研究论文的整理表格和摘录内容。数据集整合了文献元数据、PDF文件、Crossref查询结果、ChatGPT交互记录等，支持学术研究中虚假作者归属相关的分析与验证工作。

文件详解

数据文件
文件名称：article-details.xlsx
文件格式：XLSX
字段映射介绍：包含已发表文章详情的整理表格
文件名称：index.html
文件格式：HTML
字段映射介绍：含互联网档案馆保存的GIJIR材料链接、GIJIR文章引用数据列表及相关链接
文件名称：ybs-works.json
文件格式：JSON
字段映射介绍：2024年9月22日Crossref查询获取的出版商作品结果
文件名称：ChatGPT（目录）
内容介绍：包含生成某期刊主题虚假文章的提示词与响应记录
文件名称：global-us/metadata/（目录）
内容介绍：2024年9月10日收集的文章元数据HTML文件
文件名称：global-us/global-us.mellbaou.com/index.php/global/article/download/（目录）
内容介绍：2024年9月10日抓取的期刊文章PDF副本
文件名称：spinellis business - Google Scholar.pdf
文件格式：PDF
内容介绍：2025年2月6日“spinellis business”谷歌搜索查询打印件
可执行文件
文件名称：Makefile
内容介绍：编排文章分析流程的命令集合
文件名称：get-metadata.sh
内容介绍：从期刊网站获取文章元数据页面的shell脚本
文件名称：apply-to-pdfs.sh
内容介绍：将指定Python脚本应用于所有文章PDF的shell脚本
文件名称：extract-citations-emails.py
内容介绍：从文章PDF提取可能的文本内引用数量及通讯作者邮箱的Python脚本
文件名称：extract-doi-affiliations.py
内容介绍：从文章元数据提取DOI和机构信息的Python脚本
文件名称：extract-all-doi-affiliations.sh
内容介绍：从所有文章元数据提取DOI和机构信息的shell脚本
文件名称：emails-to-csv.awk
内容介绍：将邮箱和文章编号转换为带邮件发送URL的CSV格式的awk脚本
压缩包
文件名称：replication.zip
文件格式：ZIP
内容介绍：包含上述所有数据文件与可执行文件的压缩包

适用场景

学术诚信研究：用于分析虚假作者归属现象的方法验证与案例研究
文献元数据分析：通过文章元数据、引用信息探究作者归属的真实性
学术文本处理：利用脚本工具提取PDF文献中的DOI、机构、邮箱等关键信息
学术出版合规性检测：辅助识别学术文章中可能存在的虚假作者归属问题
研究方法复现：支持相关学术研究中方法与分析流程的复现验证

数据与资源

15047991.zipZIP
67.69 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	67.69 MiB
最后更新	2026年1月4日
创建于	2026年1月4日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

False_Authorship_Methods_and_materials_虚假作者归属研究数据包

数据集概述

文件详解

适用场景

数据与资源

附加信息

注册成功！