证书透明度机器人身份与行为分析数据集

数据集概述

该数据集是论文《不速之客:证书透明度机器人身份与行为分析》的配套数据,包含证书透明度(CT)机器人的身份标识与行为记录相关数据,以及说明文档和处理代码,为研究CT生态中的自动化程序提供支持。

文件详解

  • 文档与说明文件:
  • Dataset Artifact Readme.pdf:PDF格式,数据集说明文档,包含数据集的背景、使用方法等信息
  • 数据文件:
  • ctpot_data.csv:CSV格式,证书透明度机器人行为数据,核心字段包括request_timestamp(请求时间戳)、host(主机)、user_agent(用户代理)、client_ip(客户端IP)、country_name(国家名称)等
  • 代码文件:
  • parse_dataset.py:Python格式,数据集解析代码,用于读取和处理ctpot_data.csv数据
  • 环境配置文件:
  • requirements.txt:TXT格式,Python依赖包列表,记录运行parse_dataset.py所需的环境依赖

适用场景

  • 网络安全研究:分析证书透明度生态中自动化机器人的行为模式与身份特征
  • 网络流量分析:识别异常CT请求流量,区分自动化程序与正常用户访问
  • 证书安全研究:探究CT机器人对证书注册、分发流程的影响
  • 恶意行为检测:基于机器人的用户代理、IP特征等数据,构建恶意CT机器人识别模型
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 433.28 MiB
最后更新 2025年12月14日
创建于 2025年12月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。