谷歌竞赛自然语言处理模型特征数据集-2021

谷歌竞赛自然语言处理模型特征数据集-2021 数据来源：互联网公开数据标签：谷歌竞赛,NLP,自然语言处理,特征向量,模型配置,数据集,Parquet,CSV

数据概述：本数据集包含用于谷歌竞赛的自然语言处理（NLP）模型的各种特征和配置信息。数据集组织成多个文件夹，每个文件夹代表不同的NLP模型配置和特征。具体包括：

config文件夹：包含四种类型的文件 - features：存储各种特征向量的Parquet文件 - ids：包含不同配置的唯一标识符的Parquet文件 - runtime：详细记录不同配置运行时间的Parquet文件 - 以上文件的CSV版本，便于访问

edge文件夹：包含代表NLP模型图中边特征的Parquet文件

node文件夹：包含三个子文件夹 - node_opcode：存储图中每个节点的操作的Parquet文件 - node_splits：详细记录图中节点分割方式的Parquet文件 - node_feat：包含节点特征的Parquet文件

数据用途概述：该数据集适用于自然语言处理模型的研究、开发和竞赛。研究人员和开发者可以利用此数据集进行模型配置的比较分析、特征工程和性能评估。此外，数据集还适用于教学和培训，帮助学习者理解NLP模型的内部机制和特征表示方法。

数据与资源

字段	值
版本	1.0
数据集大小	655.88 MiB
最后更新	2025年6月1日
创建于	2025年6月1日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。