-
test_Based_通用测试文档与数据文件集合
2026年2月1日 30 117 104
数据集概述 本数据集为标题为“test”的通用测试数据集合,包含2个文件,无目录结构。文件类型涵盖文档类和数据类,分别为.md格式文档和.xlsx格式数据文件,两类文件数量各占总数的百分之五十。 文件详解 文档类文件 文件名称:clearDSLs.md 文件格式:MD 字段映射介绍:未提供内容预览,无法获取具体字段信息 数据类文件 文件名称:data...
-
Bangla_Based_孟加拉语信息检索测试集数据
2026年1月31日 30 192 166
数据集概述 本数据集为孟加拉语信息检索测试集,包含1182份文档(182份泰戈尔的短篇故事、小说、散文,1000份2013年《普罗托姆·阿洛》报纸文章)、94条不同复杂度的查询及查询-文档相关性判断,填补了孟加拉语信息检索标准数据集的空白。 文件详解 文件名称:README.txt 文件格式:TXT...
-
Delphi_Study_Round1_调研文档数据集
2026年1月31日 30 51 35
数据集概述 本数据集为德尔菲研究第一轮(Round 1)的调研文档集合,包含十五份文档,主要记录德尔菲研究第一轮的相关内容,无明确命名模式,文件类型以docx为主,用于支持德尔菲研究的调研分析工作。 文件详解 文档文件集合(document_files)...
-
PAN16_Based_作者身份识别文档聚类测试训练数据
2026年1月30日 30 81 63
数据集概述 本数据集为PAN16作者身份识别聚类任务的文档集合,包含至多一百篇单作者文档,所有文档语言与体裁一致,但主题或文本长度可能不同。数据集未明确说明包含的不同作者数量,旨在用于识别文档间的作者身份关联及同一作者的文档分组。 文件详解 文件名称:pan16-author-clustering-test-and-training.zip...
-
Kremlin_Based_俄罗斯政府网站爬取总统讲话记录_1999_2019
2026年1月19日 30 34 19
数据集概述 本数据集为1999年12月31日至2019年12月31日期间从俄罗斯政府网站kremlin.ru爬取的文档集合,包含10,723份文档,覆盖总统讲话记录等内容,支持政府信息研究与文档分析。 文件详解 主要数据文件 文件名称:Kremlin.json、Kremlin.rds 文件格式:JSON、RDS...
-
Incitefull_IRM_Based_信息检索模型与实验文档集合
2026年1月26日 30 60 10
数据集概述 本数据集包含5个以DOCX格式存储的文档,主题围绕信息检索模型(IRM)、信息查找模型、信息检索实验及搜索技术展开,还包含一份名为INCITEFUL的文档,为信息检索领域的研究提供基础文档资源。 文件详解 文件名称:INFORMATION RETRIEVAL MODEL.docx 文件格式:DOCX...
-
ACEM_10005_Supplementary_Based_ACEM项目10005号补充文件数据
2026年1月6日 30 190 153
数据集概述 本数据集为ACEM 10005项目的补充文件集合,包含1个文件,无目录结构,未检测到文件命名模式,无训练/测试、数据/标签、原始/处理数据的划分。数据集仅包含文档类文件,无自述文件或内容预览。 文件详解 文件名称:Supplementary materials S1.docx 文件格式:DOCX...
-
美国鱼类和野生动物管理局关系数据库文档集
2025年12月23日 30 5 0
数据集概述 本数据集是从美国鱼类和野生动物管理局(FWS)Servcat系统获取的文档档案,包含与美国鱼类和野生动物资源管理相关的报告、备忘录及其他材料,按主题分类存储于压缩文件中。 文件详解 文件名称: Relational_Database.zip 文件格式: ZIP压缩包(.zip) 内容说明:...
-
多特蒙德_勒特林豪森格吕克奥夫药房历史档案数据集
2025年12月23日 30 108 56
数据集概述 本数据集包含德国多特蒙德-勒特林豪森格吕克奥夫药房的历史档案资料,主要为1924年及1948年的历史问卷、索引卡及部分公开附件,通过Kalliope门户编目,记录该药房的历史发展相关信息。 文件详解 71006.tiff:TIFF格式文件,为光栅图像文件,可能包含药房历史档案的扫描图像资料...
-
美国鱼类及野生动物管理局文档_矢量数据集
2025年12月10日 30 171 138
数据集概述 本数据集包含美国鱼类及野生动物管理局(FWS)Servcat系统中的文档档案,聚焦矢量数据集主题,涵盖与美国鱼类和野生动物资源管理相关的报告、备忘录等材料,以压缩文件形式存储。 文件详解 文件名称:Vector_Dataset.zip 文件格式:ZIP(.zip) 内容说明:包含从FWS...



