-
加泰罗尼亚通用网络爬取语料库2020
2025年12月4日 30 205 101
数据集概述 该数据集是加泰罗尼亚语文本语料库的子库,通过爬取2020年7月最受欢迎的500个.cat和.ad域名获取,包含约四亿三千五百万个词、一千九百四十五万余句和一百零一万六千余篇文档,文档以单行新行分隔,用于语言学或自然语言处理研究。 文件详解 文件名称: catalan_general_crawling.zip 文件格式: ZIP(.zip)...
-
Objaverse_Sąsiadka_Based_地理坐标关联三维模型完整数据
2025年12月4日 30 135 50
数据集概述 本数据集包含名为“Sąsiadka”的三维模型数据,附带坐标信息(50.7413, 22.8893),包含三维模型文件及多张缩略图,支持三维模型相关的查看与分析。 文件详解 三维模型文件:69d4a30e29654b529e9833e4716a96cf.glb,格式为.glb,存储三维模型数据...
-
Objaverse_Jägerstein_Based_雅格斯坦3D模型完整数据_补充说明_按要求仅输出5个标准文件名_修正说明_原输入中_适用场景_部分包...
2025年12月4日 30 182 0
数据集概述 该数据集包含与Jägerstein相关的3D模型文件及配套缩略图,核心为1个GLB格式3D模型文件和5个JPEG格式缩略图文件,未进行训练测试、数据标签或原始处理数据的拆分,文件结构简单。 文件详解 该数据集包含6个文件,具体说明如下: - 3D模型文件: -...
-
Objaverse_1800s_Crypt_Based_1800年代地窖数字化完整数据
2025年12月4日 30 72 63
数据集概述 本数据集包含1800年代地窖主题的数字资产,从460万张图像筛选至140万张上传,包含用于预览的图片文件和三维模型文件,需清理后可用于模型构建,为相关数字重建或可视化提供基础数据。 文件详解 图片文件(.jpeg格式,共5个):...



