找到1个数据集

标签: 副文本处理

过滤结果
  • d_Prose德语文学散文文本数据集1870_1920

    2025年12月16日 30 18 14

    数据集概述 该数据集包含1870至1920年间出版的2511篇德语文学散文文本,涵盖通俗与高雅文学叙事,单篇文本不少于1000词。数据集经去重、去副文本处理,提供纯文本文件及元数据表格,支持自动化文本分析。 文件详解 文件名称:...
    packageimg