-
Hindawi_Based_19_20世纪阿拉伯文学计量风格测试语料库_数据集
2026年1月20日 30 185 81
数据集概述 本数据集包含19世纪至20世纪初的三类阿拉伯文学文本语料库,用于计量风格测试。涵盖Jurji Zaydan的22部编年历史小说、8位作者的65部作品、28位作者的300部作品。文本经标准化处理,适配R stylo工具,原始来源为Hindawi平台,压缩包内为UTF8编码的清洁文本文件。 文件详解 主文件...
-
IN01057_Halsi_Based_Harivarman_4年授予文书梵语XML数据
2026年1月13日 30 126 73
数据集概述 本数据集包含IN01057号Harivarman统治第4年的Halsi授予文书的梵语XML文件,无附加元数据。文件记录了古代授予文书的梵语文本内容,是研究古代印度历史、铭文和梵语文学的重要原始资料,总计包含1份文件。 文件详解 梵语文书文件 文件名称:IN01057.xml 文件格式:XML...
-
KBNL03000040140_Entangled_Histories_乌得勒支地区公告集转录数据1856
2025年12月31日 30 75 67
数据集概述 本数据集为《Mr. Johan van de Water's Groot plakkaatboek 'slands van...
-
社交媒体文本标准化可定制流程数据集
2025年11月29日 30 186 67
数据集概述 该数据集是与2017年发表的研究论文相关的资源首次发布,包含一个压缩文件夹,提供了用于社交媒体文本标准化的可定制流程相关资源,具体内容需参考压缩包内的README文件。 文件详解 文件名称:resources.zip 文件格式:ZIP(.zip)...



