Sensorium对话语料库_检索增强生成

数据集概述

该数据集是为Sensorium ARC项目(海洋数据探索与生态诗意气候传播的交互式AI代理系统)构建的多模态文本语料库,包含生态艺术档案、科学报告、项目框架及诗意对话转录等PDF文档,作为检索增强生成(RAG)的核心数据库。

文件详解

  • 数据集包含一个压缩文件:
  • 文件名称: corpus.zip
  • 文件格式: ZIP压缩包
  • 内部文件(解压后):包含15个PDF文档及1个README.md文档,具体包括生态艺术哲学文献、项目框架、NASA数据文档、诗意对话转录等,如ForceMajeureBook.pdf、NASA Data.pdf、[transcript] Sensorium for the World Ocean.pdf等

适用场景

  • 海洋数据探索AI系统的检索增强生成(RAG)模型训练与部署
  • 生态艺术哲学与气候传播的跨学科研究
  • 多模态对话系统中领域特定知识库的构建
  • 生态诗意交互设计的案例分析
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 75.21 MiB
最后更新 2025年12月21日
创建于 2025年12月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。