-
BigGrams半监督HTML信息提取系统数据集
2025年12月15日 0 161 140
数据集概述 该数据集为BigGrams半监督HTML信息提取系统相关的参考数据集,包含从真实网站抓取的网页数据,以及对应网站的人工标注参考实例数据,用于支持半监督信息提取方法的研究与验证。 文件详解 数据集包含一个ZIP压缩文件,解压后包含两个主要文件夹,具体说明如下: - 压缩文件: bigrams-reference-data-...
-
Text2KGBench本体驱动文本生成知识图谱基准数据集
2025年12月13日 30 153 110
数据集概述 该数据集是用于评估语言模型在本体引导下从文本生成知识图谱能力的基准,包含Wikidata-TekGen(十个本体、一万三千四百七十四句)和DBpedia-WebNLG(十九个本体、四千八百六十句)两个子数据集,遵循本体约束提取文本事实。 文件详解 数据集以压缩包形式提供,内部结构及内容如下: - 压缩包文件:...
-
子镜头分割评估标注数据集
2025年12月13日 0 200 41
数据集概述 本数据集包含33个单镜头视频的人工标注子镜头分割真值数据,用于评估运动驱动的用户生成视频细粒度时间分割方法,涵盖自有视频、业余视频及电影片段三类,共674个子镜头过渡。 文件详解 核心文件:...
-
基于物联网的活动检测服务生成器原型与评估数据集
2025年12月10日 30 208 35
数据集概述 该数据集是物联网活动检测服务生成器原型的配套数据,包含智能工厂与智慧医疗两个场景的服务生成及评估文件。按功能分为服务生成与应用评估子文件夹,提供生成服务的Python脚本、物联网输入数据、专家标注、评估用物联网日志、真值数据及检测结果等,支持复现论文中的服务生成与评估流程。 文件详解...
-
PAN23多作者写作风格分析数据集
2025年12月7日 30 92 91
数据集概述 该数据集是PAN@CLEF2023多作者写作风格分析共享任务的专用数据,包含三个难度级别的文档集,用于训练和测试段落级风格变化检测算法,文档均为英文且风格变化仅发生在段落间。 文件详解 文件名称: pan23-multi-author-analysis.zip 文件格式: ZIP压缩包 包含内容:...
-
核桃断层X射线数据集
2025年12月6日 30 115 58
数据集概述 该数据集为核桃的开放式断层X射线数据,包含单个核桃二维切片的三种不同分辨率X射线正弦图、对应测量矩阵、原始测量正弦图,以及1200个投影的正弦图和高分辨率滤波反投影重建结果(作为真值),为断层成像研究提供多分辨率实验数据。 文件详解 文件名称: example.m,文件格式: .m,可能为示例代码文件 文件名称:...



