-
反馈中使用信息自动分类研究数据集
数据集概述 本数据集为论文《Exploring the Automatic Classification of Usage Information in Feedback》配套数据,包含标注的反馈数据文件、说明文档及相关论文,支持反馈文本中使用信息的自动分类研究。 文件详解 文档类文件:...
-
Hugging_Face模型文档数据集_偏差与许可证的实证研究论文数据集
数据集概述 本数据集是论文《How do Hugging Face Models Document Datasets, Bias, and Licenses? An Empirical Study》的复现包,包含研究相关的数据集与脚本,支持复现论文中关于Hugging Face模型文档规范的实证分析结果。 文件详解...
-
生态系统功能组SF2_2淹没矿山及其他空洞指示分布图
数据集概述 本数据集包含IUCN全球生态系统类型学(v2.0)中三级生态系统功能组SF2.2“淹没矿山及其他空洞”的指示分布图和描述性概况,涵盖关键生态特征、全球分布模式(主要/次要区域)及方法说明,为该生态系统类型的分布研究提供基础数据。 文件详解 README:无格式说明文件,介绍数据集背景、地图通用注释及使用限制...
-
计算系统模拟器_硬件故障影响模拟数据与绘图脚本
数据集概述 该数据集包含计算系统模拟器生成的硬件故障影响模拟数据及绘图脚本,用于复现展示GPU利用率指标随硬件故障变化的图表。脚本默认关闭模拟功能,仅支持绘图,数据文件已包含以支持直接生成图表。 文件详解 数据文件(.json格式,共6个): gpu_utilization.json:GPU利用率数据...
-
QM9数据集分子结构分类数据集
数据集概述 该数据集包含QM9数据集中所有分子结构的ClassyFire分类结果,覆盖近十四万种含碳、氮、氧、氟原子的有机分子,通过DFT优化为稳定结构,为分子分类研究提供结构化数据支持。 文件详解 文件名称:QM9_jsons_classified.tar.gz 文件格式:GZ压缩包(.tar.gz)...
-
LaTeX数学公式图像匹配数据集230k
数据集概述 该数据集包含超过二十三万组LaTeX数学公式及其对应的PNG格式图像,图像分辨率为72dpi且尺寸各异。数据来源于arXiv的LaTeX源文件,经解析生成,是版本3更新后的数据集,规模从十八万扩展至二十三万。 文件详解 文件夹与文件: generated_png_images文件夹:包含所有PNG格式的数学公式图像文件...
-
ICSE2024提交论文1725的复现数据包
数据集概述 该数据集是ICSE 2024会议提交论文1725的复现数据包,围绕软件解耦的研究主题,包含结构化数据文件、图表文件等,为论文研究内容提供可复现的数据支持。 文件详解...
-
qLDPC码模糊聚类解码算法论文数据集
数据集概述 本数据集是论文《Ambiguity Clustering: an accurate and efficient decoder for qLDPC codes》的配套数据,包含复现论文中Figure 3图表所需的全部数据,支持相关解码算法的性能验证与结果复现。 文件详解 文件名称: BPAC_Paper_Data.zip 文件格式:...
-
IES_San_Rosendo植物访谈项目数据集2015_2017
数据集概述 该数据集是IES San Rosendo在2015-2016及2016-2017学年收集的植物相关研究数据,包含结构化数据文件、访谈音视频及植物图片,围绕植物知识、用途等主题,为植物文化研究提供多类型资料支持。 文件详解 数据文件:...
-
生态系统功能组F1_1永久性山地溪流指示性分布图
数据集概述 该数据集包含IUCN全球生态系统分类(v2.0)中三级生态系统功能组F1.1永久性山地溪流的指示性分布图及描述性档案,涵盖关键生态特征、全球分布模式(主要/次要分布区域)及方法学说明。 文件详解 README: 无格式,说明数据集背景、地图使用规则及IUCN全球生态系统分类参考链接 F1_1_Perm_upland_streams.xml:...
-
GenePT_Gene_Embeddings_Based_基因与细胞基础模型完整嵌入数据
数据集概述 该数据集包含人类基因的NCBI及UniProt(如适用)摘要文本,以及基于这些摘要通过OpenAI的text-embedding-ada-002和text-embedding-3-large模型生成的基因嵌入数据,为基因与细胞基础模型GenePT提供支持。 文件详解 文件名称: NCBI_summary_of_genes.json...
-
温带落叶林生态系统功能组T2_2指示性分布图
数据集概述 该数据集包含IUCN全球生态系统分类(v2.0)中三级生态系统功能组T2.2温带落叶林的指示性分布图及描述性档案,呈现其全球分布模式、关键生态特征及分布方法说明,为生态系统研究提供基础数据。 文件详解 README:无格式文件,包含数据集整体说明,介绍T2.2温带落叶林的分类归属及分布图的使用注意事项。...
-
NLP_LLM_Based_葡萄牙语软件工程岗位数据提取对比分析完整数据
数据集概述 本数据集围绕葡萄牙语软件工程招聘信息的数据提取任务,对比分析自然语言处理(NLP)与大语言模型(LLM)的应用效果,包含招聘信息数据文件、岗位列表及分析报告类文件。 文件详解 Vagas para Comparação.json:JSON格式文件,包含用于对比分析的葡萄牙语软件工程招聘信息数据。 Lista de cargos...
-
Building_datasets_with_malware_Flubot_Based_恶意软件样本数据分析完整数据
数据集概述 该数据集是“Building datasets with malware”安全项目的一部分,聚焦Flubot恶意软件研究。通过在机器上安装Flubot收集流量数据,包含匿名化的JSON格式数据文件和最终分析报告PDF,为恶意软件分析提供支持。 文件详解 文件名称: anonymized.json 文件格式: JSON (.json)...
-
基于本体的测试数据集
数据集概述 该数据集是一个ZIP压缩包,包含重新评估本体浏览器与组合测试工具ACTS所需的全部文件(ACTS工具除外)。核心内容包括三篇研究论文中使用的本体、测试结果及结果汇总表,支持对本体浏览器的实验复现。 文件详解 压缩包文件: OntologyBasedTesting_Zenodo.zip: ZIP格式压缩包,包含以下文件和子目录 根目录文件:...
-
ICLR提交匿名附加文件集
数据集概述 该数据集为ICLR会议提交的匿名附加文件集合,包含六种不同格式的文件,涵盖压缩包、图片、表格及结构化数据文件,为相关研究提供补充数据支持。 文件详解 OMG_Additional_File_6.zip:ZIP格式压缩文件,可能包含补充数据或文档 OMG_Additional_File_5.zip:ZIP格式压缩文件,可能包含补充数据或文档...
-
CEX项目_黄金标准全文数据集
数据集概述 本数据集为CEX项目的黄金标准全文集合,包含来自27个学科的107篇学术文章。针对每篇文章提供PDF、TEI XML、引文注释JSON、JSON-LD四种互补文件,全面捕获文献内容、结构与引文信息,为文档处理、引文分析等研究提供支持。 文件详解 基础信息文件:...
-
生态系统功能组F2_8自流泉与绿洲指示性分布图
数据集概述 该数据集包含IUCN全球生态系统分类(v2.0)中三级生态系统功能组F2.8自流泉与绿洲的指示性分布图及概况文件,涵盖全球分布模式、生态特征及技术方法,为该生态系统类型的分布研究提供基础数据支持。 文件详解 README: 无扩展名文件,提供数据集概述、地图说明及IUCN全球生态系统分类的参考链接...
-
hRSK2蛋白相互作用伙伴单体AlphaFold2模型_用于小线性基序预测
数据集概述 该数据集包含220个hRSK2相互作用伙伴蛋白的单体AlphaFold2 Multimer v3预测模型,每个伙伴蛋白单独建模,未包含RSK2。模型按伙伴蛋白分类存放,为小线性基序(SLiM)预测提供基础数据。 文件详解 文件名称: ZENODO_hRSK2_SLiM_predictions_monomer.zip 文件格式: ZIP压缩包...
-
实体关系建模Web编辑器与SQL转换算法数据集
数据集概述 该数据集围绕实体关系(ER)模型的现代化应用展开,包含支持增强现实/虚拟现实元建模平台的ER模型实现,以及将ER模型转换为SQL建表语句的算法相关文件,为数据库设计与自动化转换研究提供数据支持。 文件详解 文件名称: animator.ts,文件格式: TypeScript文件(.ts),未提供具体字段或功能描述 文件名称:...



