-
eBL_Based_楔形文字符号OCR识别结果数据
2026年1月31日 30 193 79
数据集概述 本数据集是电子巴比伦图书馆团队通过OCR模型对eBL平台约七万五千张楔形文字泥板照片进行识别的结果。尽管设置了高阈值以提升准确率,仍提取出约一百二十二万四千一百零九个符号。数据集包含一个JSON文件,无目录结构,未区分训练/测试、数据/标签或原始/处理数据。 文件详解 文件名称:eBL_OCRed_Signs.json 文件格式:JSON...
-
Lemazina_2021_白眉麻雀织雀鸣声序列结构挖掘数据
2026年1月29日 30 73 16
数据集概述 本数据集包含南非6对野生白眉麻雀织雀(P. mahali)的二重唱鸣声序列分析数据,基于论文研究结果,记录了该物种的鸣声应答规则、音节类型排序特异性及序列转换模式,涉及支持度、置信度、提升度等序列挖掘指标,共2个文件。 文件详解 README_JAB.docx 文件格式:DOCX...
-
Pakistan_Based_巴基斯坦豹种群猎物DNA分析数据
2026年1月28日 30 66 14
数据集概述 本数据集为巴基斯坦Ayubia国家公园豹种群的猎物分析数据,基于57份粪便样本的DNA食性分析结果,记录了豹的猎物构成(以家畜为主),旨在为缓解人兽冲突、保护豹种群提供数据支持。包含5个相关文件,涵盖序列数据、处理结果及说明文档。 文件详解 说明文档类 文件名称:README_for_pp_bk_filtered_data.txt...
-
KGE_HGEN_Based基因调控网络多组学关联数据集
2026年1月30日 30 60 39
数据集概述 本数据集为KGE-HGEN基因调控网络数据集,包含9个文件,涵盖基因、转录因子(TF)、微小核糖核酸(miRna)的序列信息及相互作用关系数据,可用于生物信息学领域的基因调控网络分析研究。 文件详解 序列信息文件 文件名称:target_id_seq.xlsx、mirna_id_seq.xlsx、tf_id_seq.xlsx...
-
Uberon_Based_解剖实体进化同源性注释数据v0_2
2026年1月29日 30 169 49
数据集概述 本数据集为解剖相似性注释数据v0.2,用于定义UBERON本体中解剖实体的进化关系,聚焦历史同源性概念,即捕获源于共同祖先结构的解剖结构关系。注释遵循类似基因本体联盟的指南记录证据线,每条同源性陈述为单一注释,包含参考、解剖实体术语、祖先分类单元、证据类型及置信度信息。 文件详解 文件名称:anatomical-similarity-...
-
TheyBuyForYou_DocSim_Based文档相似度众包标注数据
2026年1月21日 30 203 129
数据集概述 本数据集包含通过三种众包任务变体收集的文档对相似度判断结果,每种任务变体采用不同的标注方式(李克特量表、量级估计、排序),并记录了标注者的相似度评分、置信度及理由。数据集包含原始标注JSON文件及三种任务变体对应的处理后CSV文件,总计5个文件,用于文档相似度评估研究。 文件详解 说明文档...
-
Dryad_Replicating_单刺激设计属性失忆效应在线复现实验数据
2026年1月21日 30 73 29
数据集概述 本数据集为Dryad平台存储的单刺激设计下属性失忆效应复现实验数据,验证在线环境中属性失忆效应(被试重复报告刺激某特征后无法报告其他特征)的可复现性,展示在线实验数据质量,包含行为数据、元数据及说明文档,共5个文件。 文件详解 DisciplineSpecificMetadata.json 文件格式:JSON...
-
MODIS_Based_印尼火灾事件_严重程度_点火点数据2002_2019
2026年1月20日 30 208 205
数据集概述 本数据集基于MODIS MCD14ML主动火灾探测数据,提取了2002-2019年印尼的离散火灾事件、严重程度及点火点信息。包含火灾事件和点火点两个数据文件,提供GIS兼容格式和CSV文本格式,记录了火灾事件的唯一ID、持续时间、火辐射功率、置信度等属性,以及点火点的地理坐标和土地覆盖类型等信息,支持跨文件关联分析。 文件详解...
-
Question_Answering_SNIK_Based_医疗信息管理本体问答数据集
2026年1月14日 30 115 93
数据集概述 本数据集为基于SNIK医疗信息管理本体的问答系统相关数据,包含问答操作所用数据、训练问题及按问题类型通过特定指标完成的评估结果,涉及CSV、JSON、NT三种格式共12个文件,可用于SNIK本体问答系统的训练与性能分析。 文件详解 CSV文件(共8个) 部分文件名称:textbook-...
-
Gravitational_Wave_Treasure_Map_MS250607b_星系评分数据
2026年1月11日 60 60 16
数据集概述 本数据集包含引力波事件MS250607b初步阶段中,引力波宝藏图对应电磁对应体搜索轮廓区域内的星系排名信息。数据以JSON格式存储,核心内容为轮廓区域内星系的评分及相关信息,是研究该引力波事件电磁对应体候选星系的关键参考数据,共包含一个文件。 文件详解 文件名称:event_galaxies_MS250607b.json 文件格式:JSON...
-
North_American_proxy_records_末次盛冰期与冰消期近地表风向代用记录数据
2026年1月7日 30 208 88
数据集概述 本数据集是Conroy等人2025年论文中表1的配套文件,包含北美末次盛冰期(LGM)与冰消期的近地表风向代用记录,站点和样本按0.5度经纬度网格组织,涵盖多种代用指标类型及风向、置信度等信息。 文件详解 文件名称:Conroy2025_Table1_data.xlsx 文件格式:XLSX...
-
AMOR_Corpus_Spanish_Morality_Corpus_西班牙语在线评论道德标注数据集
2026年1月3日 30 123 32
数据集概述 本数据集是AMOR项目产出的首个可发布版本西班牙语在线评论道德基础标注语料库,包含从西班牙语Reddit社区提取并经人工筛选的评论,由训练后的标注者通过Qualtrics平台完成标注。数据涵盖标注文本及标注者档案两部分,适用于计算语言学和社会科学领域关于西班牙语在线话语中道德语言与价值表达的研究。 文件详解 语料库文件(Corpus...
-
GiantSteps_电子舞曲调式数据集
2025年12月23日 30 122 46
数据集概述 该数据集包含六百个两分钟的电子舞曲(EDM)子流派音频片段,标注有单键标签。聚焦于Beatport平台上存在问题的片段,存在偏差,但可用于测试调式识别系统的鲁棒性。数据由Daniel G. Camhi和Ángel Faraldo分析,包含音高集合描述、调式变化、注释及置信度等信息。 文件详解 压缩文件:...
-
拟南芥近亲繁殖与环境响应实验数据集
2025年12月23日 30 52 8
数据集概述 本数据集记录了多年生植物拟南芥(Arabidopsis lyrata)自然近交与异交种群在不同环境下的实验数据,包括生长室恒定条件和原生范围外的户外公共花园环境,涵盖存活率、开花物候及代谢组学等生理响应数据。 文件详解 代谢组学数据文件:...
-
开发者情感分析基准研究数据集
2025年12月20日 30 8 7
数据集概述 该数据集是一项关于软件提交信息情感与情绪分析的基准研究数据,包含实验代码、预处理脚本、模型实现文件、数据压缩包及标注指南文档,为分析开发者在代码提交过程中的情感倾向提供技术实现与数据支持。 文件详解 代码文件(.ipynb格式,共11个): sentiment_PLMs.ipynb:基于预训练语言模型(PLMs)的情感分析实验代码...
-
药物基因相互作用临床意义提取数据集_FDA标签包
2025年12月20日 30 133 78
数据集概述 本数据集围绕从FDA批准药物标签的自由文本中提取药物基因相互作用的临床意义展开,通过大语言模型(LLMs)提取适应症、癌症类型及药物基因组学信息,并利用VICC归一化服务关联至标准化概念,补充DGIdb数据库中现有相互作用数据的治疗相关性。 文件详解 数据文件:...
-
全球众包土地覆盖与土地利用参考数据集2011_2012
2025年12月19日 30 80 34
数据集概述 本数据集是基于Geo-Wiki众包平台通过四次活动收集的全球土地覆盖与土地利用参考数据,包含人类影响、土地覆盖分歧、荒野等信息,为卫星产品验证及全球陆地生态系统监测提供基础参考数据。 文件详解 数据文件(CSV格式,共4个): Global LULC reference...
-
夹竹桃科植物倒千里光型吡咯里西啶生物碱化学分类研究表3数据集
2025年12月15日 30 157 60
数据集概述 本数据集为夹竹桃科植物化学分类研究中的表3数据,聚焦倒千里光型吡咯里西啶生物碱相关的同精脒合酶样基因氨基酸基序,关联生物碱表型检测结果,为该科植物生物碱代谢功能基因研究提供基础数据。 文件详解 文件名称: table.html 文件格式: HTML (.html) 字段映射:...
-
DeepForest树冠检测Jupyter笔记本输出数据集
2025年12月14日 30 178 1
数据集概述 本数据集包含《环境数据科学手册》中发表的“Tree crown detection using DeepForest”Jupyter笔记本的输出结果,主要围绕基于DeepForest的树冠检测任务生成,涵盖检测结果数据、可视化图像及交互文档等内容。 文件详解 数据文件(CSV格式):...
-
PluColl_1994年夏秋季在线手写单词数据集
2025年12月12日 30 148 14
数据集概述 本数据集包含1994年夏秋季收集的在线手写单词数据,由奈梅亨大学手写小组与惠普布里斯托尔合作完成,惠普捐赠给国际Unipen基金会。数据包含手写单词的笔尖坐标、压力等信息及单独标记的字符,补充了Unipen数据集未涵盖的内容。 文件详解 该数据集由多个文件和目录组成,具体说明如下: - 报告文件: -...



