找到231个数据集

标签: 数据提取

过滤结果
  • 微服务云应用能效系统性研究数据集

    2025年12月5日   

    数据集概述 本数据集围绕微服务架构云应用的能效问题展开系统性研究,包含研究方案、筛选文献及数据提取表格三类文件,为该领域的系统性分析提供结构化资料支持。 文件详解 该数据集包含3个文件,具体说明如下: - 研究方案文件: - 02_slr_protocol.pdf: PDF格式,系统性文献回顾(SLR)的研究方案文档。 - 文献筛选文件: -...
    packageimg
  • 中世纪早期斯拉夫陶器形态测量分析3D工具集辅助数据集

    2025年12月5日   

    数据集概述 该数据集是基于Blender 4.3的开源3D工具集,专为考古学家设计,用于中世纪早期斯拉夫陶器等非标准、不对称手工制品的半自动化形态测量分析。工具集通过几何节点和Python脚本生成虚拟截面,提取数据并支持后续分析,包含数据提取、R语言分析及可视化相关文件,为考古器物形态研究提供技术支持。 文件详解...
    packageimg
  • AI_Ethical_Requirements_Based_人工智能伦理要求补充材料完整数据

    2025年12月5日   

    数据集概述 本数据集为人工智能时代伦理要求相关系统性文献综述(SLR)的补充材料,围绕软件开发中伦理需求的获取与管理展开,涵盖研究方法、结果及贡献,包含文献筛选、数据提取等核心文件。 文件详解 Acepted Studies.html:HTML格式文件,可能包含系统性文献综述中最终纳入的47项原始研究的详细信息。...
    packageimg
  • 代码变更质量问题识别与评审反馈分析数据集2024

    2025年12月5日   

    数据集概述 该数据集为提交至ENASE 2024的论文配套数据,包含用于分析代码变更中常见质量问题的评审反馈数据,以及数据提取、预处理的Python脚本,支持对代码评审反馈与质量问题关联的研究。 文件详解 数据文件: Jabref_pullrequest_comments.xlsx: XLSX格式,可能包含JabRef项目的拉取请求评审反馈原始数据...
    packageimg
  • 网站XML站点地图数据集

    2025年5月31日   

    网站XML站点地图数据集 数据来源:互联网公开数据 标签:XML,站点地图,CSV格式,网络爬虫,数据提取,站点分析,网页抓取,SEO优化,数据集成 数据概述: 本数据集包含多个网站的XML站点地图,以CSV格式存储。数据集由advertools函数sitemap_to_df生成,支持通过sitemap...
    packageimg
  • Goodreads图书数据ETL管道开发数据集-2023年

    2025年5月30日   

    Goodreads图书数据ETL管道开发数据集-2023年 数据来源:互联网公开数据 标签:Goodreads,ETL,数据管道,开发数据,数据处理,图书数据,数据转换,数据提取,数据加载 数据概述: 本数据集是为个人项目“Goodreads ELT...
    packageimg
  • 数据提取竞赛数据集DataExtractionCompetitionDataset-shirshaka

    2025年5月28日   

    数据提取竞赛数据集DataExtractionCompetitionDataset-shirshaka 数据来源:互联网公开数据 标签:数据提取,竞赛数据,数据集,信息提取,机器学习,自然语言处理,数据挖掘,人工智能 数据概述: 该数据集来源于一次数据提取竞赛,专注于从文本、表格或其他非结构化数据中提取结构化信息。主要特征如下:...
    packageimg
  • PDF文件结构分析数据集PDFFileStructureAnalysis-ui19co65

    2025年5月7日   

    PDF文件结构分析数据集PDFFileStructureAnalysis-ui19co65 数据来源:互联网公开数据 标签:PDF文件, 文件结构, 数据提取, 文本分析, 文档解析, 数据挖掘, 格式分析, PDF标准 数据概述: 该数据集包含来自PDF文件的数据,记录了PDF文件的结构信息,用于深入理解PDF文档的内部构成。主要特征如下:...
    packageimg
  • CSVURL数据集CSVURLDataset-codergay

    2025年4月24日   

    CSVURL数据集CSVURLDataset-codergay 数据来源:互联网公开数据 标签:数据集,CSV,URL,数据提取,网络爬虫,数据收集,数据分析,数据科学 数据概述: 该数据集包含来自互联网的CSV文件的URL链接,记录了这些文件的具体位置和基本信息。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。...
    packageimg
  • 黑科弗数据提取与文本分析数据集BlackcofferDataExtractionandTextAnalysisDataset-ramkumar45

    2025年4月24日   

    黑科弗数据提取与文本分析数据集BlackcofferDataExtractionandTextAnalysisDataset-ramkumar45 数据来源:互联网公开数据 标签:文本分析,数据提取,自然语言处理,机器学习,数据集,信息提取,文本挖掘,情感分析 数据概述:该数据集包含来自黑科弗公司的数据,专注于文本数据的提取和分析。主要特征如下:...
    packageimg
  • 兄者弟者2BroYouTube频道数据分析集-2010至2022年-lostinworlds

    2025年4月23日   

    兄者弟者2BroYouTube频道数据分析集-2010至2022年-lostinworlds 数据来源:互联网公开数据 标签:YouTube,游戏,频道分析,数据提取,游戏直播,FPS,恐怖游戏,订阅者,观众分析,2Bro,兄者弟者 数据概述: 本数据集包含YouTube频道“兄者弟者...
    packageimg
  • Artstation网站艺术作品数据分析链接数据集-2021-dimitryzub

    2025年4月23日   

    Artstation网站艺术作品数据分析链接数据集-2021-dimitryzub 数据来源:互联网公开数据 标签:Artstation,艺术作品,数据提取,3D建模,数据分析,软件使用,标签统计,公司关联,数据隐私 数据概述:...
    packageimg
  • 肯德基推特数据提取数据集KFCTweetExtractDataset-arthrow

    2025年4月23日   

    肯德基推特数据提取数据集KFCTweetExtractDataset-arthrow 数据来源:互联网公开数据 标签:社交媒体,数据提取,肯德基,推特分析,文本挖掘,情感分析,品牌监测,市场营销 数据概述:该数据集包含来自肯德基(KFC)官方推特账号及其相关推文的数据,记录了品牌在社交媒体上的互动和用户反馈。主要特征如下:...
    packageimg
  • 标题TravelTuesday推特旅行故事数据集-2022年-eliasdabbas

    2025年4月23日   

    标题TravelTuesday推特旅行故事数据集-2022年-eliasdabbas 数据来源:互联网公开数据 标签:TravelTuesday,推特,旅行故事,社交媒体,数据提取,实体识别,在线营销 数据概述:...
    packageimg
  • 网页抓取数据提取数据集WebScrapingDataExtractionDataset-muhammadusman996

    2025年4月22日   

    网页抓取数据提取数据集WebScrapingDataExtractionDataset-muhammadusman996 数据来源:互联网公开数据 标签:网页抓取,数据提取,数据集,网络爬虫,数据分析,信息检索,互联网研究,公开数据 数据概述: 该数据集通过网页抓取技术从多个互联网网站提取信息,记录了各类网页内容的数据。主要特征如下:...
    packageimg
  • Zomato餐厅信息提取数据集-2021-naarku30

    2025年4月22日   

    Zomato餐厅信息提取数据集-2021-naarku30 数据来源:互联网公开数据 标签:Zomato,餐厅信息,JSON数据,数据提取,API,数据预处理,数据分析,美食评论 数据概述: 本数据集包含了从Zomato...
    packageimg
  • 哲学家列表数据集-2021-matheusdalbuquerque

    2025年4月22日   

    哲学家列表数据集-2021-matheusdalbuquerque 数据来源:互联网公开数据 标签:哲学家,哲学,列表,Wikipedia,数据提取,BeautifulSoup,教育,研究 数据概述:...
    packageimg
  • RTEM黑客马拉松教程数据集

    2025年4月21日   

    RTEM黑客马拉松教程数据集 数据来源:互联网公开数据 标签:黑客马拉松, API教程, 数据提取, 数据清洗, 数据可视化, 时序数据, 建筑元数据, 数据分析, 竞赛参考 数据概述:...
    packageimg
  • COVID-19开放研究论文与作者数据集

    2025年4月20日   

    COVID-19开放研究论文与作者数据集 数据来源:互联网公开数据 标签:COVID-19, 论文文本, 作者信息, 开放研究, 科研协作, 数据提取, 文本挖掘 数据概述: 本数据集是对CORD-19(COVID-19开放研究数据集挑战)的论文文本和作者信息进行提取和整理的结果。数据集包含三个核心文件: 1....
    packageimg
  • 南非公司活动指标数据集

    2025年4月19日   

    南非公司活动指标数据集 数据来源:互联网公开数据 标签:公司年度报告,活动指标,南非,PDF解析,数据提取,文本挖掘,数据清洗,数据标准化,自动化处理,可持续发展指标 数据概述:...
    packageimg