-
GPT_4_Turbo_沙特法律文件翻译数据
2026年2月1日 30 50 33
数据集概述 本数据集包含由GPT-4 Turbo翻译的14份沙特阿拉伯法律文件,均为Excel格式。涵盖基础治理法、司法法、诉讼程序法、专利法等多个法律领域,无目录结构,文件直接存储,未提供训练/测试、数据/标签或原始/处理数据的划分。 文件详解 文件名称与格式:14个文件均为.xlsx格式,包括《Basic Law of...
-
MODIS_Based_软件需求追踪实验数据集
2026年2月1日 30 154 35
数据集概述 本数据集基于NASA MODIS文档修改而来,包含19条高级需求和49条低级需求,以及人工验证的需求追踪答案集(含41条正确链接)。数据用于软件需求追踪实验,支持信息检索方法(如TF-IDF、LSI)的性能评估,包含需求文本文件、答案集及实验结果表格。 文件详解 需求文件 文件夹名称:high、low(以ZIP格式存储) 文件格式:TXT...
-
Tomcat_Based软件开发bug报告数据集
2026年1月31日 30 203 131
数据集概述 本数据集由An Ngoc Lam捐赠,包含Tomcat项目的bug报告相关数据,共2个文件。数据记录了bug的基本信息、关联提交及文件变更详情,可用于支持bug定位相关的研究与分析,帮助解决bug报告与源代码间的词汇不匹配问题。 文件详解 文件名称:Tomcat.xlsx 文件格式:XLSX...
-
Bangla_Based_孟加拉语信息检索测试集数据
2026年1月31日 30 45 33
数据集概述 本数据集为孟加拉语信息检索测试集,包含1182份文档(182份泰戈尔的短篇故事、小说、散文,1000份2013年《普罗托姆·阿洛》报纸文章)、94条不同复杂度的查询及查询-文档相关性判断,填补了孟加拉语信息检索标准数据集的空白。 文件详解 文件名称:README.txt 文件格式:TXT...
-
Wikidata_Based_食品与配料RDF转储数据
2026年1月31日 30 166 93
数据集概述 本数据集是通过wdumps工具生成的Wikidata食品与配料主题RDF转储数据,包含信息说明、转储配置、RDF数据压缩包及预览文件四类文件,用于提供结构化的食品与配料关联数据。 文件详解 信息说明文件 文件名称:info.json 文件格式:JSON...
-
RLKWiC_Based_真实知识工作上下文监测数据集
2026年1月31日 30 106 60
数据集概述 本数据集为RLKWiC,是首个公开的真实知识工作上下文数据集,通过监测八名参与者两个月的计算机交互生成,包含上下文、文本内容、语义等多维度信息,旨在填补个人信息管理领域的研究空白,为用户行为建模提供支撑。 文件详解 RLKWiC.zip 文件格式:ZIP...
-
Touché23_Task2_因果问题证据检索任务数据
2026年1月31日 30 83 68
数据集概述 本数据集为Touché 2023会议因果问题证据检索任务的专用数据,包含任务所需的主题文件、相关性判断文件及结果压缩包,共5个文件,无目录层级划分,可直接用于该任务的模型训练、评估与结果复现。 文件详解 文件名称:runs-task2.zip 文件格式:ZIP 字段映射介绍:任务相关的运行结果压缩包,具体内容需解压后查看...
-
Wikidata_Based_所有食品条目RDF转储数据
2026年1月30日 30 10 4
数据集概述 本数据集是通过wdumps工具生成的Wikidata食品条目RDF转储数据,包含所有食品相关条目信息。数据以多种文件格式存储,涵盖条目元数据、规范配置、预览数据及压缩数据文件,总计四个文件,可用于食品领域信息检索与分析。 文件详解 info.json 文件格式:JSON...
-
INNOSETA_Source_行业解决方案数据库2020
2026年1月30日 30 200 153
数据集概述 本数据集为INNOSETA数据库中的行业解决方案数据,包含一个Excel文件,记录相关行业解决方案的信息,可用于行业解决方案的查询与分析。 文件详解 文件名称:D1.7_Database_INDUSTRY_SOLUTIONS_INNOSETA_(2020).xlsx 文件格式:XLSX...
-
BIRCO_Based_LLM系统评估用精选信息检索数据集
2026年1月30日 0 166 100
数据集概述 本数据集是经过精心整理的现有信息检索数据集集合,适用于基于大型语言模型(LLM)的系统评估。包含DORIS-MAE、ArguAna、WhatThatBook、Clinical-Trial和RELIC五个子数据集,每个子数据集均包含查询文本、语料库文本及查询相关性评分,支持LLM系统的检索性能评估。 文件详解...
-
BioASQ_Based_生物医学专家真实需求问答基准数据集
2026年1月29日 30 58 30
数据集概述 本数据集为BioASQ生物医学问答基准数据集,包含英文问题、标准参考答案及相关材料,反映生物医学专家真实信息需求,兼具挑战性与实用性。数据集融合结构化与非结构化数据,除精确答案外还包含理想答案(摘要形式),适用于问答系统、多文档摘要、信息检索等多任务研究,且随BioASQ挑战赛持续扩展。 文件详解 README文件 文件名称:README...
-
Eclipse_Based_Bug定位HyLoc模型研究数据
2026年1月29日 30 153 149
数据集概述 本数据集为Eclipse Platform UI项目的Bug定位研究数据,包含论文中提出的HyLoc模型(结合深度神经网络与rVSM信息检索技术)相关的实验数据与元数据,用于解决Bug报告与源代码间的词汇不匹配问题,提升Bug定位准确率。 文件详解 Eclipse_Platform_UI.xlsx 文件格式:XLSX...
-
SciExpeM_Based_燃料研究XML元数据_2020版
2026年1月28日 30 136 111
数据集概述 本数据集为SciExpeM项目下的燃料研究相关XML元数据,由Lhuillier、Brequigny等作者关联,对应2020年《Fuel》期刊论文(卷263,编号116653),包含一份XML格式的元数据文件,用于记录燃料研究相关的结构化信息。 文件详解 文件名称:10.5281/zenodo.7334962.xml 文件格式:XML...
-
孟加拉语语音识别测试集_重新审视Anwesha扩展金标准数据集
2026年1月28日 30 177 80
数据集概述 本数据集为孟加拉语信息检索(IR)测试集,扩展了现有黄金标准数据集,包含100个查询-文档相关性对及1000篇文档的新测试集。文档来源于Ebela、Zee News等新闻平台及旅游博客,支持不同复杂度查询的检索性能评估,是孟加拉语IR研究的基础资源。 文件详解 BSE_qrels.json 文件格式:JSON...
-
SUIN_Based哥伦比亚司法法令详细数据1999_2022
2026年1月28日 30 116 22
数据集概述 本数据集为哥伦比亚司法系统SUIN平台1999至2022年的法律体系法令详细数据,涵盖司法领域的法令信息。数据集以单一文件形式呈现,可用于研究哥伦比亚司法体系的法令内容及演变情况。 文件详解 文件名称:Colombia. Justicia. SUIN. 1999 2022. Ordenamiento Jurídico. Decretos...
-
ZENODO_资料来源_雅加达圣法蒂玛教堂与新月楼_文化遗产文档
2026年1月28日 30 171 57
数据集概述 本数据集围绕雅加达的GEREJA ST. FATIMA(圣法蒂玛教堂)和CANDRA NAYA(andra Naya)作为文化遗产的主题展开,包含1份文档文件,存储于Zenodo平台,未划分训练/测试、数据/标签或原始/处理子集,文件类型单一为docx格式。 文件详解 文件名称:Zenodo.docx 文件格式:DOCX...
-
Hubbl_Based_医疗EHR实施变更管理应用数据_2017
2026年1月28日 30 105 9
数据集概述 本数据集记录了Hubbl移动应用在电子健康记录(EHR)"大爆炸"式上线过程中,用于变更管理的相关数据,涵盖用户注册、功能使用、任务完成及信息检索等核心内容,反映应用在EHR实施中的作用。 文件详解 文件名称:HubblData.xlsx 文件格式:XLSX...
-
Crossref_metadata_processed_data
2026年1月28日 30 198 156
数据集概述 本数据集包含来自Crossref的元数据处理文件,主要用于学术文献相关的元数据管理与分析。数据结构简单,无复杂目录层级,仅包含一个核心文件,未进行训练测试、数据标签或原始加工的拆分,专注于提供结构化的元数据信息。 文件详解 文件名称:metadatakrok3.xlsx 文件格式:XLSX...
-
BPID_Based_个人身份去重基准数据集_EMNLP2024
2026年1月28日 30 54 27
数据集概述 本数据集为EMNLP 2024论文《BPID: A Benchmark for Personal Identity Deduplication》的配套基准数据,用于个人身份去重任务。数据集以压缩包形式提供,无训练/测试、数据/标签、原始/处理数据的划分,包含1个压缩文件。 文件详解 文件名称:BPID.zip 文件格式:ZIP...
-
Wikidata_Dump_Paclitaxel药物RDF转储数据
2026年1月27日 30 96 69
数据集概述 本数据集为Wikidata中Paclitaxel药物相关的RDF转储数据,由wdumper工具生成。包含实体、陈述及三元组信息,共四个文件,涵盖数据规格、元信息、预览及压缩数据等内容,可用于生物医药领域的药物信息分析与研究。 文件详解 info.json 文件格式:JSON...



