找到340个数据集

标签: 语料库构建

过滤结果
  • 任务型聊天机器人评估数据集_TOFU_R与BRASATO

    2025年12月5日   

    数据集概述 本数据集包含与任务型聊天机器人评估相关的研究材料,核心为TOFU-R数据集(GitHub上Rasa开源聊天机器人快照)和BRASATO数据集(TOFU-R的精选子集),以及数据集构建脚本和ChatGPT参数分析文件。 文件详解 文件名称:rasa-chatbot-datasets.zip 文件格式:ZIP压缩包 包含内容: TOFU-...
    packageimg
  • Objaverse_Szurpiły_Based_文化遗产三维数字化完整数据

    2025年12月5日   

    数据集概述 该数据集包含Szurpiły相关的三维模型数据,涵盖坐标信息(54.23426, 22.88419)及配套文件,为三维模型相关研究与应用提供数据支持。 文件详解 三维模型文件:9dc34133159c4a479b763f621262db11.glb,GLB格式,为Szurpiły的三维模型文件...
    packageimg
  • 父子模型网格云数据集10级

    2025年12月5日   

    数据集概述 该数据集包含与“父子”主题相关的网格云模型数据,以10级分类呈现,包含图片预览文件和三维模型文件,支持对特定模型的查看与使用。 文件详解 图片预览文件(共4个,JPEG格式):thumb0.jpeg、thumb1.jpeg、thumb2.jpeg、thumb3.jpeg,用于快速查看模型内容...
    packageimg
  • 早期现代拉丁炼金术印刷品语料库数据集_EMLAP

    2025年12月5日   

    数据集概述 本数据集记录早期现代拉丁炼金术印刷品语料库,包含精选数字转录样本、元数据目录、带自动形态标注的句子数据、词形还原句子及预处理脚本,用于自动隐喻检测等文本分析研究。 文件详解 文件名称: CCS-ZCU/EMLAP_ETL-v0.5.zip 文件格式: ZIP压缩包 包含内容:...
    packageimg
  • 日式茶具三维模型与预览图数据集

    2025年12月5日   

    数据集概述 本数据集包含日式茶具的三维模型文件及配套预览图,主要由JPEG格式预览图和GLB格式三维模型组成,为日式茶具的数字化展示与研究提供基础资源。 文件详解 三维模型文件:54b8b77328224fcb826cd2c128f6eef8.glb,格式为GLB,包含日式茶具的三维模型数据...
    packageimg
  • 盎格鲁_撒克逊长矛物品数据集1993_1474

    2025年12月5日   

    数据集概述 该数据集包含英国约克郡东区苏厄比盎格鲁-撒克逊墓地出土的长矛物品数据,通过0.5毫米结构光扫描并经手动数字编辑处理,提供文物的数字扫描文件及预览图。 文件详解 文件名称: thumb0.jpeg、thumb1.jpeg、thumb2.jpeg、thumb3.jpeg、thumb4.jpeg 文件格式: JPEG (.jpeg) 内容说明:...
    packageimg
  • 短语动词的解读问题数据集

    2025年12月5日   

    数据集概述 本数据集围绕短语动词的解读问题展开,核心内容为相关主题的文档资料,为理解短语动词解读难点提供支持。 文件详解 文件名称: Shahlo Kamalova.pdf 文件格式: PDF (.pdf) 文件内容: 包含关于短语动词解读问题的文档资料 适用场景 语言学研究: 分析短语动词的语义特征与解读障碍 英语教学应用:...
    packageimg
  • Tsammalex动植物词汇数据库0_3版

    2025年12月5日   

    数据集概述 该数据集为Tsammalex 0.3版,是一个关于动植物的词汇数据库,聚焦语言贡献维度,由Christfried Naumann等编辑,2015年发布于马克斯·普朗克进化人类学研究所。 文件详解 文件名称:tsammalex-data-v0.3.zip 文件格式:.zip(压缩包) 内容说明:压缩包内包含Tsammalex...
    packageimg
  • IN02086_Minanatha水道石刻铭文翻译数据集

    2025年12月5日   

    数据集概述 本数据集包含IN02086 Minanatha水道石刻铭文的翻译文件,以文档形式呈现,涵盖同一内容的两种格式文件,为研究该石刻铭文的内容提供了直接的文本资料。 文件详解 文件名称:IN02086 CXL Mīnanath Water Conduit.docx 文件格式:docx...
    packageimg
  • 象形文字与象征性铭文图像数据集

    2025年12月5日   

    数据集概述 本数据集包含英国图书馆藏巴黎地区手稿中的一页象形文字与象征性铭文图像相关文件,核心内容为紫色背景纪念碑式结构及符号的全页微型画,提供JPG格式缩略图及GLB格式模型文件,支持多维度查看需求。 文件详解 文件类型及分布: JPEG格式文件(共7个):包含thumb0.jpeg至thumb6.jpeg等缩略图文件,用于快速预览图像内容...
    packageimg
  • 老人行走三维模型与纹理素材集

    2025年12月5日   

    数据集概述 本数据集包含基于老人行走三维扫描模型的处理结果,涵盖重拓扑后的低面数模型及相关纹理素材,以JPEG图片和GLB三维文件形式呈现,用于展示老人行走模型的三维资产与视觉效果。 文件详解 三维模型文件: 0f7535dc9dd1492e842cd6b2d23f4885.glb:GLB格式三维模型文件,为重拓扑后的老人行走模型,面数约3.6k...
    packageimg
  • 维京盾牌变体模型数据集

    2025年12月4日   

    数据集概述 本数据集包含一个维京盾牌变体模型及其配套缩略图,旨在呈现该模型的视觉效果与三维结构,为相关设计或展示场景提供基础素材。 文件详解 文件名称:thumb0.jpeg、thumb1.jpeg、thumb2.jpeg、thumb3.jpeg、thumb4.jpeg 文件格式:JPEG(.jpeg)...
    packageimg
  • 乌兹别克语翻译中文化与民族特征传递问题及方法研究

    2025年12月4日   

    数据集概述 本数据集包含一篇关于乌兹别克语翻译中文化与民族特征传递问题及方法的研究文档,聚焦于翻译过程中相关特征传递的难点与解决途径,为翻译理论与实践研究提供参考资料。 文件详解 数据集包含一个PDF格式的文档文件,具体如下: - 文件名称: Hujumova Kamola Obidovna.pdf - 文件格式: PDF (.pdf) - 文件内容:...
    packageimg
  • 圣犹达_塔迪厄斯吊坠艺术作品数据集

    2025年12月4日   

    数据集概述 本数据集为圣犹达·塔迪厄斯吊坠的艺术作品数据,包含该吊坠的三维模型文件及多张缩略图,呈现其视觉外观与立体形态,为相关艺术展示或研究提供基础素材。 文件详解 三维模型文件:12407e519aac46d0856fe60a63c5ca51.glb,格式为.glb,存储吊坠的三维模型数据...
    packageimg
  • CHILDES_decision_Based_儿童语言决策行为分析完整数据

    2025年12月4日   

    数据集概述 该数据集包含一个名为zenodo.zip的压缩文件,未提供具体内容描述,推测与CHILDES相关的决策类数据相关,具体内容需解压后查看。 文件详解 文件名称: zenodo.zip 文件格式: ZIP压缩包(.zip) 内容说明: 压缩包内具体文件及字段信息未提供,需解压后获取详细内容 适用场景...
    packageimg
  • 加泰罗尼亚通用网络爬取语料库2020

    2025年12月4日   

    数据集概述 该数据集是加泰罗尼亚语文本语料库的子库,通过爬取2020年7月最受欢迎的500个.cat和.ad域名获取,包含约四亿三千五百万个词、一千九百四十五万余句和一百零一万六千余篇文档,文档以单行新行分隔,用于语言学或自然语言处理研究。 文件详解 文件名称: catalan_general_crawling.zip 文件格式: ZIP(.zip)...
    packageimg
  • Objaverse_Source_Thoracata_romana_Based_博物馆展品三维数字化完整数据

    2025年12月4日   

    数据集概述 本数据集包含名为“Thoracata romana”的三维模型及配套图片资源,来源于对Chiclana博物馆展品的拍摄记录,旨在呈现该展品的视觉信息与三维形态,为相关研究或展示提供素材支持。 文件详解...
    packageimg
  • Objaverse_CA_HF65_8_Based_三维模型与缩略图数据集合集

    2025年12月4日   

    数据集概述 本数据集包含一个三维模型文件和五张缩略图文件,以哈希值命名,无目录结构,未划分训练/测试集、数据/标签集或原始/处理集,主要文件类型为JPEG格式图片。 文件详解 文件列表及格式: 三维模型文件:facd52018aa1454f81e557e5221a5535.glb,格式为.glb...
    packageimg
  • 催化反应词汇数据集

    2025年12月4日   

    数据集概述 该数据集围绕催化反应领域的专业词汇构建,核心内容为一个压缩格式的词汇文件,未提供进一步的描述信息。 文件详解 文件名称: vocabulary.zip 文件格式: ZIP压缩包 文件内容: 压缩包内包含催化反应领域的词汇数据,具体内容需解压后查看。 适用场景 化学工程研究: 可用于催化反应领域的术语标准化或专业词典构建。 自然语言处理:...
    packageimg
  • 罗马尼亚小说语料库2021年4月版

    2025年12月4日   

    数据集概述 该数据集是2021年4月发布的罗马尼亚小说语料库(ELTeC-rom),包含95部按第一层级编码的小说,提供了小说元数据、说明文档及压缩文件包,为欧洲文学文本相关研究提供基础数据支持。 文件详解 文件名称: metadata.csv 文件格式: CSV 字段映射: 包含id(编号)、author-name(作者名)、book-...
    packageimg