-
法律案例文档摘要数据集
2025年12月19日 30 179 166
数据集概述 本数据集包含三个法律案例文档摘要数据集,分别为印度最高法院的抽象式摘要数据、印度最高法院的专家提取式摘要数据以及英国最高法院的抽象式摘要数据,用于支持法律文档摘要方法的研究与评估。 文件详解 README.md:Markdown格式文档,介绍数据集背景、包含的三个子数据集(IN-Abs、IN-Ext、UK-Abs)的来源及内容说明。...
-
西班牙语医学语义索引开发数据集
2025年12月18日 30 123 92
数据集概述 该数据集为西班牙语医学语义索引(MESINESP)开发集,含七百五十条经人工标注的医学文献记录,标注使用DeCS编码(西班牙语版MeSH术语),每条记录至少由两名索引员标注并达成共识,可用于医学语义索引相关研究。 文件详解 压缩文件: mesinesp-development-set.zip,格式为ZIP,包含两个开发子集 官方开发集:...
-
AGORA_AI治理与监管档案数据集
2025年12月15日 30 36 9
数据集概述 该数据集是AI治理与监管档案(AGORA)的集合,包含人工智能相关法律、法规、标准及其他治理文档的元数据、摘要和全文。数据集以压缩包形式存储,为研究AI领域治理框架提供结构化资源。 文件详解 文件名称: agora.zip 文件格式: ZIP压缩包 (.zip) 文件内容:...
-
多文档摘要对话语料集
2025年4月27日 30 49 48
多文档摘要对话语料集 数据来源:互联网公开数据 标签:多文档摘要,对话结构,元评论生成,学术论文,自然语言处理,文本摘要,机器学习 数据概述:...
-
文档摘要对数据集Document-AbstractPairsDataset-sark07
2025年4月25日 30 53 22
文档摘要对数据集Document-AbstractPairsDataset-sark07 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,深度学习,文本生成,机器翻译,信息检索,NLP 数据概述: 该数据集包含文档及其对应的摘要,旨在用于文本摘要生成任务。主要特征如下: 时间跨度: 数据记录的时间范围不固定,取决于原始文档的发布时间。...
-
文档摘要生成数据集DocumentAbstractiveSummarizationGivenQueryDataset-jastorj
2025年4月25日 30 49 14
文档摘要生成数据集DocumentAbstractiveSummarizationGivenQueryDataset-jastorj 数据来源:互联网公开数据 标签:文档摘要,摘要生成,自然语言处理,机器学习,文本分析,问答系统,数据集,信息检索 数据概述:该数据集包含来自多个来源的文档及其对应的摘要,适用于基于查询的文档摘要生成任务。主要特征如下:...



