找到2个数据集

标签: 段落文本

过滤结果
  • Global_Stocktake_Based全球气候行动进展多语言机器学习分析数据

    2026年1月15日 30 177 35

    数据集概述 本数据集为《Progress on Climate Action: a Multilingual Machine Learning Analysis of the Global Stocktake》一文的配套数据,包含全球盘点气候行动相关的文本嵌入、文档项、主题关键词及段落、降维嵌入和元数据概述,支持气候变化领域的多语言文本分析研究。...
    packageimg
  • 土佐日记现代日语及英语翻译数据集

    2025年12月12日 30 71 0

    数据集概述 本数据集是《土佐日记》的现代日语及英语翻译文本集合,包含原文及对应翻译内容,以JSON格式存储,涵盖标题、作者、段落文本、假名注音、直译与意译等多维度信息,为古典文学翻译与研究提供结构化资源。 文件详解 该数据集包含一个压缩文件,具体说明如下: - 文件名称: yamagen/tosa-translation-v1.0.0.zip -...
    packageimg