-
PAN18跨域作者身份识别数据集
数据集概述 该数据集提供跨域作者身份识别问题的语料库,覆盖英语、法语、意大利语、波兰语、西班牙语5种语言,包含已知候选作者同人小说与未知同人小说,通过JSON文件标注问题信息、真实作者及集合信息。 文件详解 文件名称: pan18-cross-domain-authorship-attribution-dataset.zip 文件格式: ZIP压缩包...
-
IUCN全球生态系统功能组M1_6潮下带岩礁指示性分布图
数据集概述 本数据集包含IUCN全球生态系统分类体系(v2.0)中三级功能组M1.6潮下带岩礁的指示性分布图及描述性档案,涵盖生态特征、分布模式等信息,地图以红黄色标识主次分布区域,需结合分辨率限制使用。 文件详解 README:无格式文件,包含数据集基本说明、地图使用规则及背景信息...
-
意大利果园褐纹蝽图像数据集2024
数据集概述 该数据集包含2024年意大利果园生长季通过物联网设备采集的褐纹蝽(BMSB/HH)图像数据,含原始图像、标注文件及数量统计,为褐纹蝽识别研究提供支持。 文件详解 压缩文件: DatasetV3.zip(.zip格式),包含以下子文件夹和文件: Images文件夹: 含原始JPEG图像,内容为粘虫板表面拍摄的含褐纹蝽及其他昆虫的图像...
-
CodiEsp摘要与ICD10编码关联数据集
数据集概述 该数据集包含来自Lilacs和Ibecs数据库的医学摘要,通过UMLS Metathesaurus将MeSH术语映射为ICD10编码(含西班牙文CIE10),并补充了基于MeSH术语词匹配的额外编码。数据集以压缩包形式提供,包含结构化JSON文件、单篇摘要文本文件及标签映射表。 文件详解 该数据集以压缩包形式提供,具体说明如下: -...
-
工业商业项目架构重构辅助工具评估数据集
数据集概述 本数据集为工业商业项目中架构重构辅助工具的实用性评估案例研究数据,包含多种算法权重配置文件、领域模型文件及质量属性文档,覆盖架构重构分析的核心参数与参考资料。 文件详解 该数据集包含12个文件,具体说明如下: - 算法权重配置文件(JSON格式,共10个): -...
-
Taranis_AI_AIT_OSINT_Summer2024_Based_2024年5_7月网络安全新闻完整数据集
数据集概述 该数据集包含2024年5月13日至7月31日期间收集的网络安全新闻条目,通过OSINT平台Taranis AI从公共源获取,以每日JSON文件形式存储,含约一万二千条德英双语新闻,每条数据项封装单一新闻条目及相关元数据。 文件详解 文件名称: AIT-OSINT-Summer2024-v1.0.zip 文件格式: ZIP压缩包 内容说明:...
-
DeCoInt_AFUSS_VRU_Trajectory_Based_弱势道路使用者轨迹完整数据
数据集概述 该数据集包含城市交叉口的弱势道路使用者(VRU)轨迹数据,分为基础VRU轨迹数据集、扩展 cyclists 轨迹数据集和 cyclists 启动数据集,涵盖行人、cyclists 的位置、时间戳及运动状态标签等信息,用于交通研究。 文件详解 基础VRU轨迹数据集(VRUT_Dataset_complete.tar.gz):...
-
M1_5光限制海洋动物森林生态系统功能组指示性分布图
数据集概述 本数据集包含国际自然保护联盟(IUCN)全球生态系统分类(v2.0)中三级生态系统功能组M1.5光限制海洋动物森林的指示性分布图及描述性资料,涵盖关键生态特征、分布模式说明及方法学细节。 文件详解 README:无格式文件,提供数据集基本介绍、地图通用说明及IUCN全球生态系统分类链接...
-
思想动态图像_借助视觉语言模型提取查尔斯_S_皮尔士手稿中的视觉知识数据集
数据集概述 该数据集围绕“思想动态图像”主题,利用视觉语言模型从查尔斯·S·皮尔士的手稿中提取视觉知识,包含手稿图像文件、结果文件、评估文件、数据集文件及标注文件等多种类型,为相关研究提供数据支持。 文件详解 手稿图像文件:...
-
教育西班牙语问答数据集_ESQAD
数据集概述 本数据集为西班牙语教育场景下的问答生成(QAG)任务构建,包含与西班牙大学入学考试(EVAU)课程对齐的人工标注数据、文学及法律领域自动生成数据,以及经师生验证的试点研究子集,支持多场景QAG模型开发与评估。 文件详解 该数据集包含四类结构化数据文件,具体说明如下: - EVAU课程对齐数据 -...
-
计算就绪型金属有机框架数据集2025
数据集概述 本数据集是2025年更新的计算就绪型金属有机框架(CoRE MOF)数据库公开版本,包含9256个MOF结构的CIF文件及预计算材料属性,其中2737个为计算就绪型(CR)、6519个为非计算就绪型(NCR),数据涵盖截至2025年2月1日的结构信息。 文件详解 该数据集包含以下文件,具体说明如下: -...
-
IUCN全球生态系统功能组F3_3水稻田指示性分布图
数据集概述 该数据集包含IUCN全球生态系统类型学(v2.0)下三级生态系统功能组F3.3水稻田的指示性分布图及描述文件,涵盖关键生态特征、分布模式(主要为红色、次要为黄色区域),适用于区域生态系统查询,非精细定位。 文件详解 README:无扩展名文件,包含数据集概述、地图说明及IUCN生态系统类型学链接...
-
长尾在线异常检测数据集
数据集概述 本数据集为长尾在线异常检测(LTOAD)任务提供支持,包含四个基础异常检测数据集的长尾分布划分文件和测试序列,用于复现ICCV 2025相关研究论文的实验设置,推动该领域后续研究。 文件详解 根目录文件: README.md:Markdown格式的说明文档,介绍数据集结构与使用方法 子目录:...
-
生态系统功能组T2_1寒温带和温带高山区森林与林地指示性分布图
数据集概述 本数据集包含世界自然保护联盟(IUCN)全球生态系统类型学(v2.0)中三级生态系统功能组T2.1“寒温带和温带高山区森林与林地”的指示性分布图及描述性档案,用于展示该生态系统的全球分布模式及关键生态特征。 文件详解...
-
NLP_LLM_Based_葡萄牙语软件工程招聘数据对比分析完整数据
数据集概述 本数据集围绕葡萄牙语软件工程招聘信息的数据提取任务,对比分析自然语言处理(NLP)与大语言模型(LLM)的应用效果。包含结构化数据文件与分析文档,为相关技术对比研究提供数据支持。 文件详解 Vagas para Comparação.json:JSON格式数据文件,可能包含用于对比分析的葡萄牙语软件工程招聘信息原始或处理后的数据。...
-
朝鲜王朝承政院日记天气记录数字化数据集1623_1910
数据集概述 本数据集为朝鲜王朝承政院日记(1623-1910年)中的首尔地区每日天气记录数字化成果,通过文本挖掘分类天气,将原始阴阳历日期转换为公历,包含多格式数据文件,为朝鲜半岛历史气候研究提供标准化数据支持。 文件详解 核心数据文件(支持多格式):...
-
pLMMoRF预测器脚本与人类蛋白质组MemMoRF预测数据集
数据集概述 本数据集包含pLMMoRF预测器脚本及人类蛋白质组的MemMoRF预测结果。核心内容围绕膜相互作用分子识别特征的预测数据展开,包含预测脚本、实验过滤数据及人类蛋白质组预测结果文件,为相关生物信息学研究提供支持。 文件详解 文件名称: README.md,文件格式: Markdown,内容: 数据集说明文档,包含项目链接及各文件内容介绍。...
-
手部运动体现的动作捕捉数据集
数据集概述 本数据集包含通过Qualisys动作捕捉系统录制的人类手部操作动作数据,记录了右手手指运动、位置与方向,部分包含背部、肩部和肘部标记点。数据含原始录制文件及带标注的元数据,支持手部运动体现相关研究。 文件详解 数据文件: 55个JSON格式文件:...
-
基于模型的性能需求测试数据集
数据集概述 本数据集为论文《Model-Based Testing for Performance Requirements》配套数据,包含文档、数据、代码等多种类型文件,围绕基于模型的性能需求测试主题,涵盖需求分析、模型约束、评估指标等相关信息。 文件详解 文档类文件(76个): PDF文件(62个):如2005-clarus...
-
DUDE_Sample_Based_样本训练数据OCR_PDF处理完整数据
数据集概述 本数据集是DUDE平台的首个样本训练数据集,供挑战者搭建系统使用。包含OCR、PDF样本文件及数据集描述JSON文件,无目录结构,文件类型以压缩包为主。 文件详解 DUDE_sample_OCR.zip:ZIP格式压缩文件,可能包含用于OCR任务的样本数据...



