-
nlp2023_toxic_german_德语新闻评论毒性标注数据集
数据集概述 本数据集包含2021年11月4日至10日期间奥地利报纸DerStandard网站的新闻评论数据,共4473条原创评论(排除评论回复),涉及522篇文章。数据包含2818条无毒评论和1655条有毒评论,类别分布相对均衡。每条评论标注了二进制毒性标签,部分评论还包含粗俗语言、目标个体、目标群体、其他目标四类细分标签及文本位置信息。 文件详解...
-
SUNFISH_Project_Based_网络犯罪搜索索引测试数据
数据集概述 本数据集是为SUNFISH项目英国用例测试和评估创建的网络犯罪搜索索引测试数据,包含7个文件,无目录层级。数据涵盖Solr索引文件、管理模式文件及数据库定义文件,用于支持项目相关功能的测试验证。 文件详解 Solr索引文件 文件名称:solr_index1.xml、solr_index2.xml、solr_index3.xml...
-
Bayerischer_Wald_Source_雪盖持续时间地图数据
数据集概述 本数据集为Bayerischer Wald区域的雪盖持续时间地图,记录每个像素被雪覆盖的天数。雪盖持续时间(SCD)基于250米分辨率雪盖地图生成,采用Notarnicola等人2013年提出的算法。数据集包含15个文件,以栅格文件为主,辅以元数据文件。 文件详解 栅格文件(Raster files)...
-
OCEL_2_0_Based_四核心业务流程模拟对象中心事件日志数据
数据集概述 本数据集包含基于OCEL 2.0标准的模拟对象中心事件日志,覆盖订单到现金(O2C)、采购到付款(P2P)、招聘、医院患者生命周期四个核心业务流程。每个流程模拟真实工作流,涵盖多对象类型、关键活动、决策点及流程动态,为流程挖掘、分析与建模提供丰富数据支持。 文件详解 01_o2c.xml 文件格式:XML...
-
MG_Based_野生动物病原体宿主转移后CRISPR进化与丢失数据
数据集概述 本数据集围绕野生动物病原体鸡毒支原体(MG)宿主转移后的基因组进化展开,包含12株家朱雀分离株及4株家禽株的全基因组序列分析结果,重点记录CRISPR阵列的多样性变化、重复序列丢失及相关基因功能丧失情况,为研究野生鸟类细菌病原体的快速进化机制提供数据支持。 文件详解 基因组序列文件(共3个)...
-
SciExpeM_Based_工程数据_燃气轮机功率研究数据2008
数据集概述 本数据集来自SciExpeM平台,对应10.5281/zenodo.5055312,核心为Le Cong等人2008年发表于《Journal Of Engineering For Gas Turbines And Power》的研究相关工程数据,包含1个XML格式文件,无训练/测试、数据/标签、原始/处理数据拆分,目录深度为1。 文件详解...
-
基于SciExpeM的化学反应实验数据_日本化学工程杂志_2016期
数据集概述 本数据集为SciExpeM平台收录的化学反应实验数据,对应2016年《Journal Of Chemical Engineering Of Japan》发表的研究,包含1个XML格式文件,记录相关实验的元数据信息,可用于化学工程领域的实验数据管理与分析。 文件详解 文件名称:10.5281/zenodo.7904497.xml...
-
SciExpeM_Based_zenodo_5140936_工程数据
数据集概述 本数据集来自SciExpeM,关联DOI为10.5281/zenodo.5140936,包含一篇发表于《Journal Of Engineering For Gas Turbines And Power》2013年的论文相关数据,由多位作者共同贡献。数据集结构简单,包含一个目录和一个XML格式文件,无训练测试、数据标签或原始处理数据的拆分。...
-
BVerfG_L_L_Con_德国联邦宪法法院判决语料库数据_2022
数据集概述 本数据集为德国联邦宪法法院判决语料库,包含1951-2022年的判决内容,以XML格式存储。数据分为两个阶段:1951-1997年来自官方报告系列(由Mohr Siebeck Verlag提供支持),1998-2022年来自法院官网。语料库包含判决要旨、标题、主文、理由等多类标注,由L.L.Con项目创建。 文件详解...
-
corpusCOFLA_Based_弗拉门戈音乐录音元数据_2017版
数据集概述 本数据集为corpusCOFLA的元数据,包含1500余首具有代表性的经典弗拉门戈音乐录音的编辑元信息。数据源自12张商业弗拉门戈选集,提供所有曲目及选集的XML格式元数据,含艺术家、风格、MusicBrainzID等字段,是弗拉门戈音乐计算研究的基础资源。 文件详解 corpus meta data...
-
Zenodo_Source_公平性流程挖掘事件日志OCEL格式转换数据
数据集概述 本数据集是将传统事件日志转换为OCEL 1.0 JSONOCEL和OCEL 2.0 XML格式的公平性流程挖掘数据,涵盖招聘、医院、贷款、租赁四个场景,包含人员、事件层面属性及各场景的流程特征,可用于公平性评估与流程分析,共8个文件。 文件详解 招聘场景文件...
-
CafeteriaSA_Based_食品语义资源多标准标注科学摘要数据
数据集概述 本数据集是欧洲食品安全局(EFSA)资助的CAFETERIA项目成果,包含500篇科学摘要的标注内容,涉及Hansard分类法、FoodOn和SNOMED-CT三种食品语义资源,共标注6,407个食品实体。数据集可支持食品信息提取领域的自然语言处理方法开发,包含4个XML格式文件。 文件详解...
-
TraJClassifier_Based_CT轨迹数据及分类器设置数据
数据集概述 本数据集包含TraJClassifier分类器的轨迹数据及对应设置文件,以压缩包形式存储。每个方法对应文件夹内包含settings.xls设置文件与tracks.xml轨迹数据文件,轨迹数据由TrackMate测量生成,可导入TraJClassifier插件使用,核心关联医学CT领域。 文件详解 压缩包文件...
-
Project_Tycho_基于公共卫生机构_缅甸登革热病例统计数据集
数据集概述 本数据集为Project Tycho项目下的缅甸登革热报告病例数数据,时间范围覆盖1970-2006年。数据来自美国疾控中心、世界卫生组织等权威卫生机构,包含原始病例计数及标准化处理后的变量(如疾病、地点标识符),以多种格式呈现,支持登革热流行趋势与公共卫生分析。 文件详解 文件名称:MM.38362002.xml 文件格式:XML...
-
SciExpeM_zenodo_Based_燃烧化学机理数据_2010
数据集概述 本数据集为SciExpeM平台关联的燃烧化学机理数据,对应论文《Combustion And Flame, 2010, (157), 1976-1988》的补充资料,包含1个XML格式文件,用于存储燃烧化学相关的结构化数据,是研究燃烧反应机理的参考资料。 文件详解 文件名称:10.5281/zenodo.5879357.xml...
-
SciExpeM_Based_Fuel期刊2016年实验数据_原始数据
数据集概述 本数据集为SciExpeM平台收录的Fuel期刊2016年发表的实验数据,对应论文作者包括Cai Xiao、Wang Jinhua等,数据以XML格式存储,包含实验相关的结构化元数据,可用于燃料领域的科学研究与数据分析。 文件详解 文件名称:10.5281/zenodo.6651833.xml 文件格式:XML...
-
SciExpeM_zenodo_5074999_国际氢能期刊文献元数据
数据集概述 本数据集为SciExpeM项目关联的国际氢能期刊文献元数据,对应Zenodo平台编号10.5281/zenodo.5074999,文献作者为Dagaut, P和Dayma, G,发表于2006年《International Journal Of Hydrogen...
-
SciExpeM_Combustion_2004年燃烧实验XML元数据
数据集概述 本数据集为SciExpeM平台收录的2004年发表于《Combustion And Flame》期刊的燃烧实验相关元数据,由Skjøth-Rasmussen等人研究产生,包含1个XML格式文件,记录实验的核心元数据信息,用于支持燃烧实验数据的标准化管理与查询。 文件详解 文件名称:10.5281/zenodo.5055264.xml...
-
SciExpeM_Combustion_燃烧与火焰研究数据集_2022
数据集概述 本数据集来自SciExpeM平台,关联论文“Combustion And Flame, 2022, (236), 111788”,包含1个XML格式的元数据文件,记录燃烧学相关研究的结构化信息,为燃烧领域研究提供标准化数据参考。 文件详解 文件名称:10.5281/zenodo.7904197.xml 文件格式:XML...
-
JALCOS_CELEN_Based日语学习者西班牙语写作语料库_2023版
数据集概述 本数据集为日语学习者西班牙语语料库(JALCOS)1.2版,包含222名日语母语大学生(英语为第二语言、西班牙语为第三语言)2004年撰写的222篇西班牙语作文(约8.7万字)。作文基于7个主题(含议论文、记叙文),每条数据附作者背景、写作条件等元数据,遵循国际学习者语料库标准构建,用于西班牙语二语习得研究。 文件详解...



