智能合约代码摘要数据集

数据集概述

该数据集包含智能合约代码摘要相关数据,核心为智能合约的方法与注释对原始数据,以及经处理的序列字典、数字索引输入和包含SBT序列、节点序列、邻接矩阵与注释的元组数据,为智能合约代码摘要研究提供支持。

文件详解

  • 数据集包含两个压缩文件:
  • contracts.zip:包含347,410条智能合约对原始数据
  • datasets.zip:包含处理后的数据,具体如下:
  • dictionaries:各序列对应的字典文件
  • token_idx:已转换为数字索引的输入文件
  • dataset.pkl:包含317,680个(SBT sequence, nodes equence, adjacency matrix, comment)元组的文件

适用场景

  • 智能合约代码理解研究:分析智能合约方法与注释的对应关系
  • 代码摘要模型训练:用于训练智能合约代码到自然语言注释的生成模型
  • 软件工程领域研究:探索智能合约代码结构与语义表示的关联
  • 区块链技术应用分析:为区块链智能合约开发中的代码可读性优化提供数据支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 862.46 MiB
最后更新 2025年12月15日
创建于 2025年12月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。