-
European_Parliament_Based_欧洲议会全会演讲语料库列表及多语言搭配示例数据
2026年1月7日 30 186 31
数据集概述 本数据集包含2014年11月至2018年4月期间欧洲议会全会演讲语料库的演讲来源辩论列表、演讲者姓名,以及英语、法语、德语、匈牙利语中与“refugee(s)”“refugié(s)”“Flüchtling(e)”“menekült(ek)”搭配的动词示例,所有内容由论文作者识别整理。 文件详解 文件名称:List of debates...
-
Multi_CAST_Source_Sanzhi_Dargwa多语言语音标注文本数据_2311版本
2026年1月6日 30 26 4
数据集概述 本数据集为Multi-CAST多语言标注语音文本语料库的一部分,包含Sanzhi Dargwa语言的标注语音文本数据,版本为2311。数据集由班贝格大学发布,是多语言语音语言学研究的结构化资源,仅包含一个压缩文件。 文件详解 文件名称:Multi-CAST/mcsanzhi-v2311.zip 文件格式:ZIP...
-
DDoS_Attacks_Based_CICDDOS2019与CICIDS2017合并标准化数据集
2026年1月6日 30 101 70
数据集概述 本数据集是对Iman Sharafaldin等人2019年的CICDDOS2019数据集的转换,合并了两个数据集并标准化标签,移除无穷值,同时补充CICIDS2017的良性元组以提升良性数据比例,用于网络安全领域DDoS攻击相关分析。 文件详解 文件名称:ready_dataset.zip 文件格式:ZIP...
-
ComplexTransformations_Based_复杂形状变换过程视觉感知实验数据_压缩包
2026年1月6日 30 37 27
数据集概述 本数据集为论文“Visual Perception of Complex Shape-Transforming Processes”的配套数据,包含与该研究相关的实验刺激和数据文件,每个实验对应一个文件夹,内含刺激材料、实验数据及说明文本,整体以压缩包形式呈现。 文件详解...
-
Unsigned_Road_Incidents_Based_无警告标识道路事件图像数据集_预发布版
2026年1月6日 30 61 48
数据集概述 本数据集为论文预发布文件,包含超12500张无警告标识的道路事件图像,涵盖火灾、道路上的动物、道路坍塌等8类场景。数据以压缩包和数据库形式存储,提供Geograph项目图像及归因,以及来自谷歌、必应、 Flickr的图像URL,部分URL已失效,图像因版权未直接提供。 文件详解 压缩包文件1:...
-
NanoPharos_Source_Ag_TiO2_CuO纳米颗粒HepaRG细胞系剂量反应数据集
2026年1月6日 30 87 19
数据集概述 本数据集记录Ag、TiO₂、CuO三种纳米颗粒对HepaRG细胞系的剂量反应及不良反应分类,补充了通过ASCOT软件计算的纳米颗粒原子描述符,可用于纳米材料生物安全性相关研究,包含1个文件。 文件详解 文件名称:NP16_NanoPharos_HepaRG.xlsx 文件格式:XLSX...
-
South_African_Disinformation_Based_南非虚假新闻网站数据集2020
2026年1月5日 30 107 78
数据集概述 本数据集收录2020年南非虚假新闻网站相关数据,基于MyBroadband和News24 2018年调查的疑似虚假新闻网站列表,经人工整理和清洗后形成,包含5个Excel文件,涉及不同标注类别的南非虚假新闻网站内容,用于虚假新闻检测研究。 文件详解 文件名称:Fake News (sa-news.com) Fake.xlsx...
-
Flächen_und_Zeitreihenanalysen_Based_城市土地利用变化分析数据集
2026年1月4日 30 205 26
数据集概述 本数据集为项目“Flächen- und Zeitreihenanalysen (Urbanisierung mit CLC)”(方法论4.2)的属性表,由ArcGIS Pro生成,包含1990-2018年的土地利用数据,支持城市土地利用变化分析,共9个文件。 文件详解 年度属性表文件(共6个)...
-
Software_Defect_Prediction_Based_13开源Java系统缺陷预测数据集
2026年1月4日 30 164 1
数据集概述 本数据集包含36个软件缺陷预测数据集,对应13个开源Java系统的不同版本。数据集来源于S.Alhusain在2021年TechDebt会议论文相关工作,原始数据取自论文参考文献[33]和[34],为软件缺陷预测研究提供基础数据支撑。 文件详解 文件名称:Regenerated PROMISE and BPD Datasets.xlsx...
-
NER_Tutorial_Maschinelles_Lernen_数字文学机器学习NER教程训练数据
2026年1月4日 30 139 127
数据集概述 本数据集是NER教程“数字文学中的机器学习”所需的全部数据,包含模型训练用的信件分析相关文件,支持NER模型的训练与测试。数据集共5个文件,覆盖文本、表格、文档等多种格式,为数字文学领域的机器学习任务提供基础数据支持。 文件详解 数据文件 文件名称:ner_kernkorpus.txt 文件格式:TXT...
-
Predicting_Crossmodal_Correspondences_嗅觉跨模态对应预测补充材料
2026年1月3日 30 206 24
数据集概述 本数据集包含10种精油的电子鼻气味记录、68名参与者的原始感知数据,以及用于预测嗅觉跨模态对应的回归模型代码、电子鼻驱动代码和数据记录项目。涵盖气味理化数据、感知评价及分析工具,支持嗅觉与其他感官对应关系的研究。 文件详解 文件名称:Predicting the crossmodal correspondences of odors...
-
MetaShRIMPS_Training_Data_EML元数据FAIR评估报告与数据论文生成训练数据
2026年1月3日 30 50 42
数据集概述 本数据集为MetaShRIMPS项目提供训练数据,用于从EML元数据生成高质量FAIR评估报告和数据论文草稿。包含3个XML格式的EML元数据文件,涉及海岸水文学、蝙蝠物种、海洋哺乳动物等生物相关主题,无目录层级结构,文件类型单一。 文件详解 数据文件...
-
dataset_recognition_resources_IR_ML_NLP领域数据集提及标注语料库
2026年1月3日 30 42 6
数据集概述 本数据集是IR/ML/NLP领域的数据集提及标注语料库,基于原始数据集重新标注而来。包含6000个相关领域句子及数据集标注,新增了源文献中开发的新数据集标注,并将复合数据集标注拆分为单独条目,以JSON格式重新打包,含标注偏移量信息。 文件详解 文件名称:ner_dataset_recognition_sentences.json...
-
Software_Requirements_Classification_Merged_Dataset
2026年1月3日 30 183 178
数据集概述 本数据集通过融合PROMISE、PURE、IoTAC、Kaggle、SecReq五个软件需求数据集构建,包含功能需求(FRs)和非功能需求(NFRs),其中NFRs附带具体类型标签。数据集适用于二元(FR/NFR)和多类别需求分类任务,缺失标签由作者手动补充,共包含一个文件。 文件详解...
-
Twitter_Online_Public_Shaming_Twitter网络公开羞辱事件推文ID数据集
2026年1月1日 30 45 18
数据集概述 本数据集包含Twitter平台上多起公开羞辱事件的推文ID,分为约87万条未标记数据和1227条标记数据,共4个文件。数据集涵盖事件描述、标记与未标记推文ID,可用于网络公开羞辱行为的检测、分析与缓解研究。 文件详解 README 文件格式:无扩展名 字段映射介绍:包含数据集概述及各文件说明 shaming-events-...
-
Machine_Learning_Based_机器学习增强RPLC_HRMS非靶向工作流识别概率补充数据
2026年1月1日 30 130 25
数据集概述 本数据集为机器学习增强RPLC/HRMS非靶向工作流识别概率研究的补充数据,包含5个Excel文件,内容涉及模型训练用化合物列表、累积中性损失质量数据、串联质谱训练数据、RTI预测误差结果及基质匹配验证数据,支撑相关模型的训练与验证。 文件详解 Additional file...
-
Andreas_Niederquell_Based_药物对介孔二氧化硅表观亲和力色谱筛选与预测模型原始数据
2025年12月31日 30 76 67
数据集概述 本数据集为药物对介孔二氧化硅表观亲和力排序研究的原始数据,支持基于色谱筛选方法和树模型预测模型的相关分析。数据以单一文件形式存储,无分层目录结构,未进行训练测试或数据标签拆分,主要用于药物与介孔二氧化硅相互作用的原始信息记录。 文件详解 文件名称:Raw Data HILIC Paper Andreas Niederquell...
-
PPORTAL_Annotated_Portuguese_Literary_Entities_NER语料库
2025年12月31日 30 16 10
数据集概述 本数据集为葡萄牙文学实体标注语料库,适配巴西和葡萄牙文学文本,包含PER、LOC、GPE、ORG、DATE五类实体标注。语料源自25部不同作者与风格的文学作品,含125,059个标记和5,266个标注实体,用于支持葡萄牙语NER模型开发及文学领域探索。 文件详解 文件名称:pportal-selective.json 文件格式:JSON...
-
C_elegans_Based_NL335_gpa_3_pk35_V成年线虫食物条件下行为实验数据_2009
2025年12月30日 30 117 49
数据集概述 本数据集为秀丽隐杆线虫(C.elegans)NL335株系(gpa-3(pk35)V基因突变体)的行为实验数据,属于C.elegans行为数据库的一部分。实验记录了2009年7月10日成年雌雄同体线虫在含OP50食物的NGM琼脂培养基中的行为,包含视频追踪数据及特征提取结果,可用于分析基因突变对秀丽隐杆线虫行为的影响。 文件详解...
-
Indonesia_E_voting_Sentiment_Based_X平台印尼电子投票系统评论情感分析数据
2025年12月29日 30 152 40
数据集概述 本数据集包含印尼网民在X平台上关于印尼电子投票系统的评论数据,涵盖原始评论、翻译后内容及情感标注信息,共4个文件,支持对电子投票相关舆情的情感分析研究。 文件详解 文件名称:Translated_sentiment.xlsx 文件格式:XLSX 字段映射介绍:包含翻译后的印尼电子投票相关评论内容及对应情感分析结果...



