找到107个数据集

标签: 知识挖掘

过滤结果
  • Wikidata_Dump_human_settlements_RDF数据

    2026年1月21日 60 81 7

    数据集概述 本数据集是由wdumps工具生成的Wikidata人类聚居地RDF转储数据,包含565490个实体、3852167条陈述和9179041个三元组,共4个文件,涵盖实体元数据、转储配置及三元组数据等内容。 文件详解 文件名称:info.json 文件格式:JSON...
    packageimg
  • 慕课网阅读评估互动行为分析报告2022

    2026年2月10日 30 15 9

    数据集概述 本数据集基于在线本科课程(N=142)的Moodle平台滚动和日志数据,分析阅读与测验活动的交互关系。通过用户会话的过程和序列模式识别,得到6类会话集群及7类学习者行为集群,为自适应学习支持提供依据。数据集包含分析代码、环境配置文件及匿名化CSV数据文件。 文件详解 分析代码文件 文件名称:Analysis.ipynb 文件格式:IPYNB...
    packageimg
  • 视频级学生在线视频使用与学习分析数据集

    2026年2月10日 30 94 58

    数据集概述 本数据集包含STEM领域不同大学课程中,学生播放视频格式学习材料的学习分析数据,覆盖十年时间。数据涉及35个视频的40,453个会话、313,724条记录,还包含视频的带时间戳转录文本(含原文及英文翻译),可支持学习分析和教育数据挖掘相关研究与应用。 文件详解 字幕文件(.srt) 文件数量:36个(占比约43.9%)...
    packageimg
  • 智利拟步甲科_Baeocera_标本数据

    2026年2月9日 30 195 161

    数据集概述 本数据集为论文《Review of the genus Baeocera of Chile (Coleoptera: Staphylinidae:...
    packageimg
  • 基于课堂的游戏化教学反馈系统实验数据_2022年

    2026年2月9日 30 112 90

    数据集概述 本数据集包含论文《Taking the pulse of a classroom with a gamified audience response system》中报告的四项实验数据,以Excel文件呈现。数据用于记录游戏化课堂反馈系统在教学场景中的应用效果,支持教育评估、教学优化等研究,共包含五个文件。 文件详解 数据文件(Data...
    packageimg
  • Wikidata_RDF_Based罕见病转储数据

    2026年1月31日 30 85 49

    数据集概述 本数据集是通过wdumps工具生成的Wikidata罕见病RDF转储数据,包含4个文件,涉及JSON、GZ压缩、NT格式,记录了实体、三元组等统计信息及转储配置参数,为Wikidata罕见病知识图谱研究提供数据支持。 文件详解 info.json 文件格式:JSON...
    packageimg
  • Lemazina_2021_白眉麻雀织雀鸣声序列结构挖掘数据

    2026年1月29日 30 51 25

    数据集概述 本数据集包含南非6对野生白眉麻雀织雀(P. mahali)的二重唱鸣声序列分析数据,基于论文研究结果,记录了该物种的鸣声应答规则、音节类型排序特异性及序列转换模式,涉及支持度、置信度、提升度等序列挖掘指标,共2个文件。 文件详解 README_JAB.docx 文件格式:DOCX...
    packageimg
  • ChemSearch_Based_原始化合物数据集_2023

    2026年1月29日 30 102 27

    数据集概述 本数据集为ChemSearch研究的原始数据集,包含分别来源于ChEMBL和PubChem的两个化合物数据集。数据涵盖特定时间节点的化合物SMILES字符串,经随机打乱处理,可用于化学信息检索相关研究。 文件详解 文件名称:Datasets.zip 文件格式:ZIP 字段映射介绍:压缩包内包含两个数据集,分别为:...
    packageimg
  • ICF_Based_Atlas_ti专用葡萄牙语编码手册数据

    2026年2月8日 30 1 0

    数据集概述 本数据集为基于ICF(国际功能、残疾和健康分类)的葡萄牙语编码手册,专为Atlas.ti定性分析软件设计。主要用于健康文档的定性分析,可作为临床常规中测量工具的内容分析及ICF关联规则的基础,数据集包含一个文件。 文件详解 文件名称:codebook CIF - português atlas.ti.xlsx 文件格式:XLSX...
    packageimg
  • WMT16_Based_Scielo生物医学翻译任务单语数据集

    2026年2月8日 30 81 21

    数据集概述 本数据集为第一届机器翻译会议(WMT'16)生物医学翻译任务提供的Scielo单语数据,包含英语、西班牙语、葡萄牙语、法语4种语言的生物医学相关文本,源自Scielo数据库,共7个XML文件,无目录层级划分。 文件详解 英文生物医学文件 文件名称:en-health.xml、en-biological.xml 文件格式:XML...
    packageimg
  • 知识图谱_Wikidata_厨房用具子类数据

    2026年2月1日 30 125 30

    数据集概述 本数据集是通过wdumps工具生成的Wikidata RDF转储数据,聚焦厨房用具子类,包含实体、陈述及三元组相关信息,共四个文件,支持知识图谱相关研究与应用。 文件详解 数据文件 文件名称:info.json 文件格式:JSON...
    packageimg
  • IAC_PAC_Q_A_PAIRS问答对数据

    2026年2月1日 30 205 60

    数据集概述 本数据集包含IAC_PAC相关的问答对内容,以单一文件形式呈现,未进行训练/测试、数据/标签或原始/处理数据的划分,可用于问答系统相关的研究与应用。 文件详解 文件名称:IAC_PAC_Q&A_PAIRS.xlsx 文件格式:XLSX 字段映射介绍:未提供具体字段预览,推测包含问答对相关的核心字段(如问题、答案等)。 适用场景...
    packageimg
  • Wikidata_Based知识图谱RDF数据转储

    2026年1月31日 30 79 45

    数据集概述 本数据集为通过wdumps工具生成的Wikidata的RDF格式转储数据,包含实体、陈述及三元组等相关信息,共4个文件,涵盖JSON、NT及GZ等格式,可用于知识图谱相关研究与应用。 文件详解 数据文件 文件名称:info.json 文件格式:JSON...
    packageimg
  • CanVaxKB_Based全球癌症疫苗知识库数据

    2026年1月31日 30 17 4

    数据集概述 本数据集为CanVaxKB癌症疫苗知识库的补充文件,包含全球癌症疫苗的整合信息,涵盖疫苗类型、癌症类型、基因关联、研发状态等内容,支持用户查询、比较和分析癌症疫苗相关数据,是生物医学领域癌症疫苗研究的重要参考资料。 文件详解 Suppl_File1_VO_IDs.tsv 文件格式:TSV...
    packageimg
  • Wikidata_Dump_公司实体RDF转储数据

    2026年1月31日 30 33 32

    数据集概述 本数据集是通过wdumper工具生成的Wikidata公司实体RDF转储数据,包含4个文件,涉及JSON、NT、GZ三种格式,涵盖数据信息、预览数据、压缩数据及转储配置等内容,可用于知识图谱相关的数据处理与分析。 文件详解 info.json 文件格式:JSON...
    packageimg
  • Wikidata_Based_维基数据RDF转储数据

    2026年1月31日 30 34 0

    数据集概述 本数据集是通过wdumps工具生成的Wikidata的RDF转储数据,包含4个文件,涵盖配置信息、规范文件、压缩数据文件和预览文件四类内容,可用于获取Wikidata的结构化知识数据。 文件详解 info.json 文件格式:JSON...
    packageimg
  • Wikidata_Dump_RDF格式知识图谱数据转储

    2026年1月30日 30 190 119

    数据集概述 本数据集是通过wdumps工具生成的Wikidata的RDF格式转储数据,包含实体、陈述和三元组等信息,总文件数4个,涵盖JSON、NT和GZ等格式,可用于知识图谱相关的研究与应用。 文件详解 info.json 文件格式:JSON...
    packageimg
  • Wikidata_Dump_企业信息RDF转储基础数据

    2026年1月30日 30 190 69

    数据集概述 本数据集是使用wdumps工具生成的Wikidata企业信息RDF转储,包含企业相关数据的基础文件,涵盖配置信息、元数据及数据预览等内容,共包含4个文件,支持企业信息的知识图谱构建与分析。 文件详解 文件名称:info.json 文件格式:JSON...
    packageimg
  • QSAR_Based_抗黑色素生成剂酪氨酸酶抑制预测数据集

    2026年1月29日 30 122 87

    数据集概述 本数据集为抗黑色素生成剂的酪氨酸酶抑制活性预测QSAR数据集,包含六十九个硫代氨基脲衍生物的相关数据,用于阐明化合物抑制酪氨酸酶的关键理化性质,助力新型先导分子的发现。数据集含四个文件,涵盖图表、预测结果、描述符及结构统计信息。 文件详解 Plots and AD.xlsx 文件格式:XLSX...
    packageimg
  • MatBERT_Based_带隙预测专家标注数据集2023

    2026年1月29日 30 136 46

    数据集概述 本数据集为论文“Toward Accurate Interpretable Predictions of Materials Properties within Transformer Language...
    packageimg