找到19个数据集

标签: Wikipedia

过滤结果
  • Objaverse_Metropolis_Maschinenmensch_Based_科幻电影机器人角色数字化完整数据

    2025年12月22日 30 164 38

    数据集概述 该数据集包含与1927年德国科幻电影《大都会》(Metropolis)相关的文件,主要涉及电影中的机器人角色“ Maschinenmensch”。数据集由5个JPEG格式的缩略图和1个GLB格式的3D模型文件组成,为研究电影视觉元素提供了基础素材。 文件详解 图片文件(共5个):...
    packageimg
  • 诺斯费拉图_点云数据集

    2025年12月19日 30 5 2

    数据集概述 该数据集包含与1922年德国表现主义恐怖电影《诺斯费拉图》相关的点云及图像文件,涉及电影背景、角色等视觉内容,为研究电影视觉元素或点云数据应用提供支持。 文件详解 文件类型及分布:...
    packageimg
  • WiLI_2018_Wikipedia_Based_多语言文本识别基准数据集

    2025年12月12日 30 164 110

    数据集概述 该数据集是Wikipedia语言识别基准数据集,包含235种语言的235000个段落,数据分布均衡,并提供训练集和测试集的划分。 文件详解 文件名称: wili-2018.zip 文件格式: ZIP压缩包(.zip) 内容说明: 压缩包内包含数据集的完整内容,具体字段及结构需解压后查看原始文件 适用场景 自然语言处理研究:...
    packageimg
  • Objaverse_August_Gaul_Based_文化场景三维数字化完整数据

    2025年12月7日 30 121 52

    数据集概述 该数据集包含August Gaul创作的石雕作品相关文件,作品为1910年揭幕的纪念碑,纪念波兹南动物园首位园长,1974年增设百年纪念牌匾。 文件详解 3D模型文件: 0408df61171040dfbdc14519e296bcbe.glb: GLB格式,包含石雕作品的三维模型数据 图片文件:...
    packageimg
  • 哈格马塔纳博物馆古代雕刻大理石数据集

    2025年12月5日 30 123 22

    数据集概述 该数据集包含一件来自伊朗哈格马塔纳古城遗址内哈马丹石博物馆的古代雕刻大理石文物的数字化成果,通过约30张照片制作而成,为研究该文物的形态特征提供视觉与三维数据支持。 文件详解 图片文件(5个):格式为.jpeg,包括thumb0.jpeg至thumb4.jpeg,为文物不同角度的缩略图...
    packageimg
  • 西班牙奥伦西亚城堡三维模型与图片数据集

    2025年12月4日 30 194 16

    数据集概述 该数据集包含西班牙奥伦西亚城堡的三维模型及配套图片资源,基于YouTube视频帧与维基百科信息构建,记录了城堡的建筑结构特征,如方形主体、塔楼布局等,为城堡的数字化展示与研究提供视觉化数据支持。 文件详解 三维模型文件:...
    packageimg
  • LegitPhish网络钓鱼与合法URL识别数据集

    2025年11月29日 30 195 175

    数据集概述 本数据集包含十万一千二百一十九条URL记录及十八个特征(含标签),其中网络钓鱼URL六万三千六百七十八条、合法URL三万七千五百四十条。数据来源可靠,网络钓鱼URL经人工验证,合法URL来自维基百科等可信平台,适用于URL安全检测模型训练与评估。 文件详解 文件名称: LegitPhish...
    packageimg
  • 基因_分子通路与疾病相关类别对化学暴露的敏感性数据集

    2025年11月28日 30 28 8

    数据集概述 该数据集围绕基因、分子通路及疾病相关类别对化学暴露的敏感性展开,包含化学-基因互作、基因互作计数、通路富集分析及疾病-通路关联矩阵等核心数据,为研究化学暴露的分子机制提供基础支持。 文件详解 Annotated chemical-gene interactions.xlsx:Excel格式,包含591,084条化学-...
    packageimg
  • 维基百科人类医学语料库

    2025年11月27日 30 44 13

    数据集概述 该数据集是西班牙语-英语双语单标签语料库,包含从维基百科提取的2143篇英文、469篇西班牙文人类医学文档,分为替代医学、心脏病学等22个类别,为医学文本研究提供双语分类数据支持。 文件详解 该数据集包含两个文件,具体说明如下: - 文件名称: wikipedia_human_medicine_corpus.zip - 文件格式:...
    packageimg
  • 电影剧情问答数据集Wikipedia-IMDb-thedevastator

    2025年5月4日 30 22 4

    电影剧情问答数据集Wikipedia-IMDb-thedevastator 数据来源:互联网公开数据 标签:问答,自然语言处理,电影,剧情,Wikipedia,IMDb,文本,机器阅读理解,语义理解 数据概述:...
    packageimg
  • 大型语言模型数据集LlamaDataset-simakov

    2025年4月25日 30 32 0

    大型语言模型数据集LlamaDataset-simakov 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本数据,语言模型,预训练,人工智能,文本生成 数据概述: 该数据集包含 Llama 项目收集的用于训练大型语言模型的数据,旨在支持文本生成,对话理解等多种自然语言处理任务。主要特征如下:...
    packageimg
  • 维基百科问答核心指代消解数据集2021-thedevastator

    2025年4月22日 30 176 82

    维基百科问答核心指代消解数据集2021-thedevastator 数据来源:互联网公开数据 标签:问答系统,核心指代,阅读理解,自然语言处理,Wikipedia,教育,科研 数据概述:...
    packageimg
  • 哲学家列表数据集-2021-matheusdalbuquerque

    2025年4月22日 30 82 64

    哲学家列表数据集-2021-matheusdalbuquerque 数据来源:互联网公开数据 标签:哲学家,哲学,列表,Wikipedia,数据提取,BeautifulSoup,教育,研究 数据概述:...
    packageimg
  • 智能问答聊天机器人用户交互与知识检索数据集-sadmansakibmahi

    2025年4月21日 30 149 66

    智能问答聊天机器人用户交互与知识检索数据集-sadmansakibmahi 数据来源:互联网公开数据 标签:聊天机器人,自然语言处理,问答系统,知识库,信息检索,文本处理,用户交互,Wikipedia,数据分析 数据概述:...
    packageimg
  • LLM科学考试数据集-多样化数据源整合-竞赛专用

    2025年4月15日 30 62 17

    LLM科学考试数据集-多样化数据源整合-竞赛专用 数据来源:互联网公开数据 标签:LLM, 科学考试, 数据集, 机器学习, 自然语言处理, 文本生成, 考试, 训练数据, MMLU, ChatGPT, Wikipedia 数据概述: 本数据集是为 LLM (大型语言模型, Large Language Model) 科学考试竞赛准备的, 包含了 6...
    packageimg
  • Spotify收录的CSNY音乐特征数据集

    2025年4月15日 30 68 37

    Spotify收录的CSNY音乐特征数据集 数据来源:互联网公开数据 数据集说明: 本数据集聚焦于知名民谣摇滚团体 Crosby, Stills, Nash & Young(CSNY)及其成员间的二重奏、三重奏合作作品,融合了 Spotify、AllMusic 与 Wikipedia...
    packageimg
  • PC组件分类数据集

    2025年4月15日 30 18 16

    PC组件分类数据集 数据来源:互联网公开数据 标签:PC组件,硬件配置,计算机组装,ITX,ATX,M-ATX,产品信息,图像数据 数据概述:...
    packageimg
  • 音乐记录流行度数据集

    2025年4月14日 30 57 33

    音乐记录流行度数据集 数据来源:互联网公开数据 标签:音乐产业,流行音乐,数据分析,歌曲预测, Billboard排行榜,音乐属性,艺术家分析 数据概述: 本数据集收录了1990年至2010年间登上Billboard Hot...
    packageimg
  • 韩国电视剧信息综合数据集2023

    2025年4月14日 30 95 75

    韩国电视剧信息综合数据集2023 数据来源:互联网公开数据 标签:韩国电视剧,电视剧列表,演员信息,播出日期,剧集类型,IMDB评分,播出平台,剧集标签,数据爬虫,BeautifulSoup,MyDramalist,Wikipedia 数据概述:...
    packageimg