找到32个数据集

标签: 众包标注

过滤结果
  • Crowd_Based_用户需求在线反馈众包标注结果数据

    2026年1月30日 30 94 81

    数据集概述 本数据集为Figure Eight平台开展的众包标注实验结果,来源于REFSQ 2020发表的论文研究。核心内容是对在线反馈中的用户需求进行识别与分类的标注数据,可用于需求工程领域的模型训练与验证,仅包含一个压缩文件。 文件详解 文件名称:Crowd based annotation.zip 文件格式:ZIP(压缩文件)...
    packageimg
  • InfoTabS_Based_表格推理可信性证据提取标注数据集

    2026年1月29日 30 85 26

    数据集概述 本数据集为论文配套资源,包含InfoTabS数据集训练集的证据行标注结果、测试集标注结果(源自Gupta et al. 2022)、标注模板及统计信息。标注覆盖16248个训练集表格-假设对,由90名标注者完成81282条标注,多数投票一致性F1值达89.49%,支持可信表格推理的证据提取研究。 文件详解...
    packageimg
  • NewsNinja_Based_媒体偏见众包标注数据集_2023

    2026年1月28日 30 42 4

    数据集概述 本数据集是通过News Ninja游戏收集的众包标注数据,用于提升语言媒体偏见的自动检测能力。数据包含玩家标注的句子偏见标签、专家对比标注及玩家人口统计信息,所有数据匿名化处理,可支持媒体偏见检测模型训练与标注一致性分析。 文件详解 ExportNewsNinja.csv 文件格式:CSV...
    packageimg
  • Naturalis_Based博物馆馆藏数字化采集者与鉴定者关联数据

    2026年1月26日 30 139 36

    数据集概述 本数据集为Naturalis生物多样性中心博物馆馆藏在存储单元级别数字化后的标本数据,关联了标本对应的采集者与鉴定者信息。数据由志愿者通过Bionomia平台标注,基于全球生物多样性信息机构(GBIF)聚合的标本数据集,以Frictionless Data数据包格式组织,包含九份文件。 文件详解 压缩文件(共8个)...
    packageimg
  • ECQuAD_GoBots_Based_巴西电商问答阅读理解开发数据集

    2026年1月26日 30 207 15

    数据集概述 本数据集是针对巴西电商平台的阅读理解问答数据集(ECQuAD),由众包工作者基于商品描述标注问题,遵循SQuAD-v2格式,包含可回答与不可回答问题。数据集为开发版本,供公开使用,由GoBots提供,仅含一个文件。 文件详解 文件名称:ecquad_dev_v2.json 文件格式:JSON...
    packageimg
  • CrowdTruth_Based_众包命名实体黄金标准数据_v1_0

    2026年1月23日 30 150 98

    数据集概述 本数据集包含通过混合多命名实体识别(Multi-NER)众包增强方法,在英文维基百科句子中识别和分类命名实体的实验结果,提供众包标注的命名实体黄金标准数据,支持自然语言处理领域的相关研究与应用。 文件详解 文件名称:CrowdTruth/Crowdsourcing-NamedEntities-GoldStandard-v1.0.zip...
    packageimg
  • MAESTRO_Synthetic_多标注者强标签估计数据集_2021

    2026年1月23日 30 37 8

    数据集概述 本数据集用于研究众包场景下的强标签估计,包含20个由Scaper生成的合成音频文件、参考标注及众包标注结果。音频源自freesound.org的Urban Sound 8k数据集片段,标注通过Amazon Mechanical Turk完成,可支持声音事件检测的众包标签处理研究。 文件详解 LICENSE.txt 文件格式:TXT...
    packageimg
  • Diptera_PAS_双翅目标本采集者与鉴定者关联数据_package

    2026年1月22日 30 46 21

    数据集概述 本数据集记录波兰科学院动物研究所(PAS)双翅目标本馆中,标本与采集者、鉴定者的关联信息。数据由志愿者通过Bionomia平台标注,基于全球生物多样性信息机构(GBIF)聚合的标本数据,以Frictionless Data数据包格式组织,包含9个文件,支持生物标本采集与鉴定人员关联分析。 文件详解 数据文件包(Frictionless...
    packageimg
  • LibriTTS_Based_语音重音众包标注数据集_ICASSP2024

    2026年1月21日 30 49 47

    数据集概述 本数据集为ICASSP 2024相关论文的配套数据,包含对LibriTTS数据集train-clean-100分区中三千六百二十六条...
    packageimg
  • Bionomia_国家博物馆植物标本收藏的相关数据_包括采集者和鉴定者的信息

    2026年1月20日 30 90 14

    数据集概述 本数据集为国家博物馆植物馆藏的自然历史标本数据,关联了标本的采集者与鉴定者信息。数据由Bionomia平台志愿者标注生成,基于全球生物多样性信息设施(GBIF)聚合的标本数据,以Frictionless Data数据包格式呈现,含9个文件,用于生物标本数据的关联分析。 文件详解 压缩文件(共8个)...
    packageimg
  • Paired_Human_and_LLM_free_text_survey_data

    2026年1月18日 30 69 16

    数据集概述 本数据集包含两组配对数据,模拟公众咨询场景。人类数据集涵盖约一千名英国居民对五个类公众咨询问题的自由文本回答,包含受访者自标主题标签及三名众包工作者的标注;LLM数据集基于人类回答生成,包含同一问题下的合成回复,由预设主题、角色设定及人类回答示例引导生成。 文件详解 人类调查数据文件...
    packageimg
  • Bionomia_Linked_Gippsicola蜘蛛属修订采集者与鉴定者关联数据

    2026年1月18日 30 5 3

    数据集概述 本数据集为《Gippsicola蜘蛛属修订》研究关联的采集者与鉴定者自然历史标本数据,由Bionomia志愿者标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据构建,以Frictionless数据包格式组织,包含9个文件,支持生物分类学研究中采集者与鉴定者信息的关联分析。 文件详解 压缩文件集(共8个,.zip格式)...
    packageimg
  • Bionomia_Based_Magdalena大学软体动物标本采集者鉴定者关联数据

    2026年1月18日 30 102 35

    数据集概述 本数据集为Magdalena大学生物收藏中软体动物标本的采集者与鉴定者关联数据,由Bionomia志愿者标注生成,基于GBIF聚合的标本数据。包含11个文件,以压缩包和JSON格式存储,涵盖标本记录、人员关联及问题数据等内容,用于生物标本数据的人员信息关联分析。 文件详解 核心数据文件 文件名称:occurrences.csv.zip...
    packageimg
  • Bionomia_Linked_两栖动物标本采集者鉴定者关联数据_package

    2026年1月15日 30 83 77

    数据集概述 本数据集是Bionomia平台通过志愿者标注生成的两栖动物标本关联数据,包含标本与采集者、鉴定者的关联信息,以及相关引用、文献和问题记录等内容,以Frictionless Data数据包格式组织,共9个文件。 文件详解 核心数据文件(.zip格式)...
    packageimg
  • Bionomia_Based_Talaus属蟹蛛标本采集者与鉴定者关联数据_package

    2026年1月13日 30 69 65

    数据集概述 本数据集为蟹蛛属Talaus Simon, 1886的分布与分类学研究提供标本关联数据,包含与采集者、鉴定者相关的信息。数据由Bionomia志愿者标注,基于GBIF聚合的标本数据集,以Frictionless Data数据包格式组织,共九个文件,支持生物分类学与标本数据管理研究。 文件详解 压缩文件(共8个)...
    packageimg
  • Orbiniidae_Review_Based_澳大利亚环节动物标本采集者与鉴定者关联数据

    2026年1月12日 30 28 20

    数据集概述 本数据集关联了《澳大利亚Orbiniidae科(环节动物门,定居亚纲)综述》中的自然历史标本数据与采集者、鉴定者信息,由Bionomia志愿者标注,基于全球生物多样性信息机构(GBIF)聚合的标本数据构建,以Frictionless Data数据包格式组织,包含9个文件。 文件详解 压缩文件(ZIP格式)...
    packageimg
  • Webis_Query_Segmentation_Corpus_2010网络查询分割众包标注数据

    2026年1月11日 30 143 21

    数据集概述 本数据集为Webis Query Segmentation Corpus 2010(Webis-QSeC-10),包含53,437条网络查询的分割标注结果,标注由Mechanical...
    packageimg
  • Bionomia_Based_NICOTIANA_INSECTICIDA标本采集者鉴定者关联数据

    2026年1月7日 30 131 59

    数据集概述 本数据集为“994. NICOTIANA INSECTICIDA”相关的自然历史标本数据,包含标本与采集者、鉴定者的关联信息。数据由Bionomia平台志愿者标注,基于全球生物多样性信息机构(GBIF)聚合的标本数据集构建,采用Frictionless Data数据包格式组织。 文件详解 压缩文件(共8个)...
    packageimg
  • Bionomia_Linked_HabitatVision真菌标本采集者鉴定者关联数据_Package

    2026年1月2日 30 90 2

    数据集概述 本数据集为HabitatVision(Jacob Heilmann-Clausen)采集的真菌标本数据,包含与采集者、鉴定者的关联信息。数据由Bionomia平台志愿者标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据,以Frictionless Data数据包格式组织,共9个文件,支持生物标本元数据的关联分析。 文件详解...
    packageimg
  • Bionomia_Linked_林奇堡学院拉姆齐_弗里尔植物标本馆采集者与鉴定者关联数据_package

    2026年1月1日 30 35 6

    数据集概述 本数据集为林奇堡学院拉姆齐-弗里尔植物标本馆的自然历史标本数据,包含标本与采集者、鉴定者的关联信息。数据由Bionomia平台志愿者标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据,以Frictionless Data数据包格式呈现,含9个相关文件。 文件详解 归档文件(共8个,格式均为ZIP)...
    packageimg