-
Topic_Modeling_Based_社会与新闻媒体主题建模基准数据集
2026年1月21日 30 126 29
数据集概述 本数据集为主题建模任务提供基准数据,包含20个新闻组数据集及Reddit健康论坛r/Cancer的帖子集合,用于比较基于粒子群优化(PSO)的聚类方法与传统主题建模技术。数据集共4个文件,支持NLP领域的主题建模研究与算法评估。 文件详解 文档类文件 文件名称:readme.docx 文件格式:DOCX...
-
IN02001_Based_昌古纳拉扬石柱东轴梵语铭文XML数据_Draft
2026年1月20日 30 12 2
数据集概述 本数据集包含IN02001昌古纳拉扬石柱东轴铭文的梵语文本,以XML格式存储,为Epidoc标准的草稿版本,计划纳入Siddham档案。数据无元数据,仅包含一份核心文件,用于铭文的数字化保存与研究。 文件详解 核心文件 文件名称:IN02001.xml 文件格式:XML...
-
IN01005_Based_Pravararaja君主Mallar宪章梵语XML数据
2026年1月18日 30 175 94
数据集概述 本数据集包含IN01005号Pravararaja君主Mallar宪章的梵语XML文件,未附带元数据。数据集仅含一个文件,无目录层级划分,无训练测试、数据标签或原始/处理数据的拆分。 文件详解 文件名称:IN01005.xml 文件格式:XML...
-
IN01035_Sanskrit_Bennur_Krsnavarman_II授权文书XML数据
2026年1月12日 30 32 12
数据集概述 本数据集包含编号为IN01035的Bennur Grant of Kṛṣṇavarman II梵语XML文件,未包含元数据。文件记录了Kṛṣṇavarman II的授权文书内容,为研究古代梵语历史文献提供原始文本数据支持,数据集仅有一个文件。 文件详解 文件名称:IN01035.xml 文件格式:XML...
-
IN01007_Sanskrit_Based_Sudevaraja_Kauvatal特许状梵语文本XML数据
2025年12月29日 30 77 25
数据集概述 本数据集包含Sudevaraja的Kauvatal特许状的梵语文本,以XML格式存储,未包含元数据。数据集仅含一个文件,无目录层级,无训练/测试、数据/标签或原始/处理数据的划分,文件类型单一为XML格式。 文件详解 文件名称:IN01007.xml 文件格式:XML...
-
henryrzepa_wordpress_Based_2006_2015年7月18日博客文章及评论完整导出数据
2025年12月28日 30 30 9
数据集概述 本数据集为Wordpress博客导出的XML文件,包含Henry Rzepa在2006年至2015年7月18日期间发布的四百四十篇博客文章及相关评论,是研究该时间段内特定主题博客内容的原始文本数据。 文件详解 文件名称:henryrzepa.wordpress.2015-07-19.xml 文件格式:XML...
-
激光吸收对法布里_珀罗折射率测量影响数据集
2025年12月11日 30 84 65
数据集概述 本数据集为论文《Effect of absorption of laser light in mirrors on Fabry-Pérot based refractometry》的配套数据,包含论文全文、实验与模拟相关的图表文件(PNG、FIG格式)及图表对应的原始文本数据,为复现和验证研究结果提供支持。 文件详解 论文文件:...
-
伦巴第地区中等职业学校变革实验室研讨会匿名转录文本2016_2017
2025年12月8日 30 180 123
数据集概述 本数据集包含2016至2017年间,意大利伦巴第地区某中等职业学校变革实验室研讨会的匿名转录文本,涵盖人文、科学、技术教师及助教共三十七名参与者的讨论内容。 文件详解 文件名称: CLAnonimizzato.pdf 文件格式: PDF (.pdf) 内容说明:...
-
法布里_珀罗腔折射法中空腔模式频率自动化低不确定度评估数据集
2025年12月7日 30 202 182
数据集概述 本数据集与《法布里-珀罗腔折射法中空腔模式频率自动化低不确定度评估》一文相关,包含论文原文、实验及模拟数据的图表文件、图表对应的原始文本数据,为复现和验证研究结果提供支持。 文件详解 论文文件: Zakrisson2024.pdf:PDF格式,论文正文 Zakrisson2024-Supplement.pdf:PDF格式,论文补充材料...



