找到14个数据集

标签: 清洗数据

过滤结果
  • GBIF_Based_欧洲日本金龟子分布数据_2024

    2026年1月31日 30 122 52

    数据集概述 本数据集包含截至2024年7月欧洲地区日本金龟子(Popillia japonica Newman)的分布记录,数据来源于全球生物多样性信息设施(GBIF)网站。数据集整合了原始数据、清洗后的数据及可视化图表,以及适用于地理信息系统(GIS)或建模的观测数据,为研究该物种在欧洲的分布提供支持。 文件详解...
    packageimg
  • Crow_Based_1935年中国报纸名录原始与清洗数据

    2026年1月30日 30 203 196

    数据集概述 本数据集来自1935年版《Carl Crow's Newspaper Directory of China》,包含两份文件:原始提取数据和经修正、清洗、标准化后的版本。每份文件的每一行对应一个报刊标题,记录了报刊名称、出版地、创刊年份、发行量、出版方信息、页数、栏目数等内容,是研究1935年中国报业状况的重要历史资料。 文件详解...
    packageimg
  • Crow_Based_1931年中国报纸目录原始与清洗数据

    2026年1月29日 30 178 138

    数据集概述 本数据集包含从Carl Crow 1931年版《中国报纸目录》中提取的两份文件,分别为原始提取数据和经过校正、清洗与标准化的版本。每份文件的每一行对应一个独特的报刊标题,记录了报刊名称(含英文、威妥玛拼音、中文、汉语拼音)、出版地(城市、省份)、创刊年份、发行量、出版商名称及简介、页数与尺寸、栏数与尺寸等信息。 文件详解 原始数据文件...
    packageimg
  • LLM_Personas_Based协作系统知识管理框架数据集

    2026年1月28日 0 106 8

    数据集概述 本数据集围绕协作系统中LLM生成角色的知识管理框架构建,包含源代码压缩包、LLM生成意见的相似度分析、清洗数据、嵌入数据、原始数据以及真实意见数据等6个文件,覆盖原始、处理后等不同形态的角色相关数据,支持对LLM生成角色与真实角色意见的对比分析。 文件详解 Source-Code.zip 文件格式:ZIP...
    packageimg
  • DeepSeek_Based_印尼文本写作自我表达幸福感分析数据集

    2026年1月27日 30 181 31

    数据集概述 本数据集基于90篇印尼语文章,通过DeepSeek API进行幸福感分析,包含完整数据及清洗后数据两类文件。核心内容涵盖文章基本信息、DeepSeek API生成的幸福感评分、机器人响应及评价标准等,用于研究印尼文本自我表达与幸福感的关联。 文件详解 DeepSeekAnalysis_CompleteData.xlsx 文件格式:XLSX...
    packageimg
  • Online_Social_Listening_Based_社交媒体监听原始及清洗数据集

    2026年1月13日 30 106 99

    数据集概述 本数据集为社交媒体监听数据集,包含原始数据和清洗后的数据两个文件,核心内容涉及社交媒体推文的情感分析相关信息,可用于社交媒体内容分析、情感趋势研究等场景。 文件详解 原始数据文件 文件名称:raw data.json 文件格式:JSON 字段映射介绍:包含社交媒体监听的原始数据,具体字段未明确展示,但为后续数据处理提供基础信息...
    packageimg
  • Ecosia_Related_Tweets_Social_Media_Data_2024_2025

    2026年1月6日 30 112 91

    数据集概述 本数据集包含2024年1月1日至2025年7月21日期间与Ecosia相关的推文数据,共三份文件。数据覆盖原始、清洗及标注三种形态,包含推文内容、互动数据、用户信息等核心字段,部分文件添加了情感标签,可用于分析Ecosia相关话题的社交媒体传播特征。 文件详解 ecosia_2024.xlsx 文件格式:XLSX...
    packageimg
  • CUGBZL_Supplementary_Data_Slab_Derived流体_大火山岩省机器学习分析数据集

    2025年12月28日 30 108 28

    数据集概述 本数据集为机器学习追踪Slab-Derived流体在大火山岩省中作用的补充数据,包含从GEOROC数据库及中英文期刊文献收集的原始数据、清洗后数据和预测结果三类文件,共3个文件,均为xlsx格式,无目录结构。 文件详解 Supplementary Dataset S1.xlsx 文件格式:XLSX...
    packageimg
  • 校园午餐选择调查数据集2017

    2025年12月19日 30 94 28

    数据集概述 该数据集为2017年秋季针对两所高校食堂开展的午餐供应与饮食行为调查结果,属于国家研究项目NOVANIMAL的一部分。包含原始与清洗后的问卷数据、发放信息、评论及变量说明文件,经匿名化处理以保护参与者隐私,为校园餐饮偏好研究提供数据支持。 文件详解 原始问卷数据文件:...
    packageimg
  • 甘蔗渣灰原始数据集

    2025年12月6日 30 121 4

    数据集概述 本数据集为甘蔗渣灰相关的原始数据,包含图像、文档、表格、栅格等多种格式文件,覆盖原始、清洗、过滤、归一化等不同处理阶段的数据,涉及孔隙分布、粒径分布等统计信息,为甘蔗渣灰相关研究提供多类型数据支持。 文件详解 图像文件(.jpg、.tif格式):共15个,包括RD.jpg、RAW SCBA_1.tif、sieved...
    packageimg
  • 数据2021年国家计划生育综合指数数据集

    2025年12月5日 30 154 126

    数据集概述 本数据集为2021年国家计划生育综合指数(NCIFP)的研究资料,包含经清洗的最终数据文件和对应问卷。NCIFP旨在通过分析计划生育政策与项目指标(含权利导向项目指标),支持FP2020改善政策与项目环境的工作。 文件详解 文件名称: 2021 NCIFP Data File.xlsx 文件格式: Excel (.xlsx) 内容说明:...
    packageimg
  • 罗曼语族体貌转换初步研究补充材料数据集

    2025年12月4日 30 204 79

    数据集概述 本数据集是《罗曼语族体貌转换初步研究》论文的补充材料,包含两项实验研究的相关文件,涉及法语、意大利语和罗马尼亚语三种罗曼语族语言,为探究不同无定代词引发体貌转换的能力及跨语言表现提供实验数据支持。 文件详解 实验数据文件(CSV格式):...
    packageimg
  • 亚马逊产品评论情感分析训练数据集-2021-humagonen

    2025年5月10日 30 150 58

    亚马逊产品评论情感分析训练数据集-2021-humagonen 数据来源:互联网公开数据 标签:亚马逊评论,情感分析,NLP,文本数据,产品评价,训练数据,清洗数据 数据概述:...
    packageimg
  • 火灾分割清洗数据集

    2025年4月14日 30 79 17

    火灾分割清洗数据集 数据来源:互联网公开数据 标签:火灾分割, Landsat-8, 清洗数据, 地理信息系统, 远程 sensing, 火灾监测 数据概述: 本数据集是基于Landsat-8收集的火灾分割数据集的清洗版本。数据集中仅包含火灾面积大于所有像素0.1%的掩膜。该数据集来源于学术文章《A Large-Scale Dataset for...
    packageimg