-
DP_Hermite_Based_GPCR_FEP计算输入结构基准数据
数据集概述 本数据集为DP GPCR-FEP论文的输入文件,基于Hermite™网络服务器扩展Uni-FEP应用于膜蛋白研究。包含针对8个GPCRs的139个配体的FEP计算输入结构,可作为GPCR-FEP研究的基准数据集,共1个压缩文件。 文件详解 文件名称:input_files.zip 文件格式:ZIP 字段映射介绍:压缩包内包含GPCR-...
-
IEEE_TII_Based_工业自动化系统统一功能安全评估论文补充材料
数据集概述 本数据集为IEEE TII收录论文《Unified Functional Safety Assessment of Industrial Automation Systems》的补充材料,包含复现论文结果所需的全部信息,包括技术报告、实验用例及分析结果,支持工业自动化系统功能安全评估研究的验证与扩展。 文件详解 文件名称:TII-...
-
Hang_Time_HAR_Based篮球腕戴式传感器活动识别基准数据集
数据集概述 本数据集是用于评估腕戴式传感器物理人类活动识别的基准数据集,聚焦篮球训练、 drills及比赛场景。数据由美国和德国两支球队共24名球员采集,覆盖重复训练和完整比赛,包含不同国家规则风格差异、球员技能水平异质性等特征,可支持深度学习模型基线分类性能研究。 文件详解 文件名称:hangtime_har.zip 文件格式:ZIP(压缩包)...
-
REVERINO_Based_中世纪教宗文献摘要与全文配对数据_训练基准
数据集概述 本数据集包含四千五百三十三对拉丁regesta(摘要)与对应的中世纪教宗文献全文,源自MGH和Auvray两个历史文献集,覆盖1216至1268年教宗文献。数据支持拉丁文本摘要研究与大语言模型自动摘要工具开发,可作为大语言模型处理中世纪拉丁文本的性能评估基准。 文件详解 数据文件(共9个)...
-
CO2_Reduction_Based_贝叶斯数据分析用塔菲尔斜率数据集
数据集概述 本数据集包含从CO2还原文献中提取的344个数字化并标记的塔菲尔斜率数据集,可用于贝叶斯数据分析程序,以估计塔菲尔斜率并获取其值的分布不确定性信息,支持不同模型和方法的重新分析与拟合。 文件详解 文件名称:release-dataset.zip 文件格式:ZIP...
-
SpotFlow_Based_Python库运行时方法调用与状态跟踪数据集
数据集概述 本数据集由SpotFlow工具生成,基于15个Python库(包括gzip、calendar、json等)的测试套件分析。包含两个子数据集:运行时变量值数据集和测试用例与应用方法映射数据集,用于记录软件运行时的变量状态及方法调用关系。 文件详解 运行时变量值数据集 文件名称:var_values_dataset.json.zip...
-
OGRDB_Source_小鼠CAST_EiJ品系IGH基因胚系参考数据集
数据集概述 本数据集为小鼠CAST/EiJ品系的IGH基因胚系参考序列,发布于Open Germline Receptor Database(OGRDB)。包含无间隙、有间隙的FASTA序列文件、JSON格式数据文件及许可证文件,共4个文件,可用于免疫受体基因的序列分析与研究。 文件详解 EiJ IGH_rev_1_ungapped.fasta...
-
GitTables_Based_SemTab_2022列类型检测基准数据集
数据集概述 本数据集是GitTables语料库的子集,专为2022年SemTab竞赛第三轮的列类型检测方法基准测试而整理。包含表格数据文件及对应DBpedia、Schema.org的目标列标注与真值文件,共七个文件,用于评估表格列语义类型检测模型的性能。 文件详解 文件名称:GitTables_SemTab_2022_dataset.zip...
-
Benchmark_Hybrid_Flow_Shop_调度策略比较研究数据
数据集概述 本数据集包含混合流水车间调度研究相关的两类压缩文件:基准数据集(datasets.zip)和计算结果数据集(results.zip)。基准数据来自Ruiz等(2008)、Naderi等(2010)及Wittwock(1988)的公开研究,计算结果基于论文所述算法生成,用于支持混合流水车间调度策略的比较分析。 文件详解...
-
OGRDB_Based_小鼠C57BL_6J_IGLV免疫受体种系参考数据集
数据集概述 本数据集为小鼠C57BL/6J品系的IGLV免疫受体种系参考数据,发布于开放种系受体数据库(OGRDB)。包含未带间隙、带间隙的FASTA序列文件、JSON格式数据文件及许可证文件,共4个文件,覆盖免疫受体种系序列的核心信息,是免疫遗传学研究的基础参考资料。 文件详解 未带间隙序列文件:6J...
-
Crossref_Based_2024_dump机构ROR匹配错误基准数据集
数据集概述 本数据集包含326条Crossref 2024年4月数据中机构名称与ROR ID匹配错误的记录,经人工校验筛选,排除部分低参考价值的特殊问题条目。数据可作为机构匹配算法的基准测试集,用于评估学术数据中机构名称与ROR ID的匹配准确性。 文件详解 文件名称:crossref_2024_ror_false_matches.tsv...
-
Webis_Tripad_Source_酒店评论情感流分析语料数据_2013
数据集概述 本数据集为Webis Tripad 2013情感语料库,包含2100条英文酒店评论,用于情感流分析方法的开发与评估。每条评论含总体评分、元数据及两类标注:亚马逊众包工人标注的语句情感极性(正、负、客观),以及领域专家标注的酒店相关方面信息。 文件详解 文件名称:corpus-webis-tripad-13-sentiment.zip...
-
WSDM2021_Contextualizing_新闻趋势实体上下文分析数据集
数据集概述 本数据集是基于《纽约时报标注语料库》开发的富集数据,包含149个趋势事件,涉及12万个实体。数据旨在对新闻中的趋势实体进行上下文关联,按实体对趋势的解释价值排序。数据集分为无监督(149个趋势)和有监督(训练集50个、开发集34个、测试集65个)两类评估数据,支持趋势实体解释性研究。 文件详解 文件名称:contextualizing-...
-
SegCODEBRIM_Based_混凝土桥梁缺陷图像语义分割数据集_2024
数据集概述 本数据集为SegCODEBRIM,是用于混凝土裂缝语义分割的桥梁缺陷图像数据集。图像源自CODEBRIM数据集并经人工标注,旨在支持混凝土裂缝的语义分割任务,相关内容在WACV 2024会议论文中呈现。 文件详解 文件名称:SegCODEBRIM.zip 文件格式:ZIP...
-
List_Vulnerable_Code_Snippets_代码片段链接数据库
数据集概述 本数据集为代码片段数据库,包含不同编程语言的易受攻击(不合规)和安全(合规)代码片段的在线来源链接,用于训练机器学习算法。数据源于CYBER22会议论文,因版权问题未包含代码片段本身,仅提供获取链接。数据集含1个文件。 文件详解 文件名称:Snippet_Database.xlsx 文件格式:XLSX...
-
NabilaKumala_5026211016_健康应用用户隐私政策基准数据集
数据集概述 本数据集为健康类应用用户隐私政策的基准数据集,包含一份Excel格式文件,聚焦医疗应用隐私政策相关的基准评估内容,可用于健康应用隐私政策的合规性或规范性分析。 文件详解 文件名称:Dataset Benchmark Kebijakan Aplikasi Telemedisin.xlsx 文件格式:XLSX...
-
FABind_PDBbind2020_Based_蛋白质_配体结合预处理数据集
数据集概述 本数据集是为论文“FABind: Fast and Accurate Protein-Ligand Binding”预处理的PDBbind2020数据集,包含用于蛋白质-配体结合结构预测的预处理数据,支持药物发现领域的相关研究。数据集以压缩包形式提供,便于使用。 文件详解 文件名称:pdbbind2020.zip 文件格式:ZIP...
-
OGRDB_Based_小鼠129S1_SvImJ品系IGKV基因胚系参考数据集
数据集概述 本数据集为小鼠129S1/SvImJ品系的免疫球蛋白κ轻链可变区(IGKV)基因胚系参考集,发布于Open Germline Receptor Database(OGRDB),包含4个相关文件,支持免疫球蛋白基因的序列分析与研究。 文件详解 非间隙序列文件 文件名称:SvImJ IGKV_rev_2_ungapped.fasta...
-
Hofdiarium_1665_Based德累斯顿宫廷日记库兰特手写体基准数据集
数据集概述 本数据集为17世纪萨克森库兰特手写体的手写文本识别(HTR/OCR)基准数据集,包含《选帝侯约翰·格奥尔格二世1665年宫廷日记》(SLUB Mscr.Dresd.K.80)的10页(fol.85r-89v)基准数据,采用eScriptorium完成图像与文本对齐,提供多种格式文件及转录指南。 文件详解 压缩包文件...
-
Leveraging_Natural_Language_图形程序合成数据集_2020
数据集概述 本数据集为程序合成数据集,包含图形程序任务及语言注释(含合成注释与人工注释),用于支持自然语言在程序搜索与抽象学习中的应用研究。该数据集关联论文目前处于NeurIPS 2020审稿阶段,审稿后将进行匿名解除处理。 文件详解 文件名称:logo.zip 文件格式:ZIP...



