谷歌竞赛自然语言处理模型特征数据集-2021

谷歌竞赛自然语言处理模型特征数据集-2021 数据来源:互联网公开数据 标签:谷歌竞赛,NLP,自然语言处理,特征向量,模型配置,数据集,Parquet,CSV

数据概述: 本数据集包含用于谷歌竞赛的自然语言处理(NLP)模型的各种特征和配置信息。数据集组织成多个文件夹,每个文件夹代表不同的NLP模型配置和特征。具体包括:

config文件夹:包含四种类型的文件 - features:存储各种特征向量的Parquet文件 - ids:包含不同配置的唯一标识符的Parquet文件 - runtime:详细记录不同配置运行时间的Parquet文件 - 以上文件的CSV版本,便于访问

edge文件夹:包含代表NLP模型图中边特征的Parquet文件

node文件夹:包含三个子文件夹 - node_opcode:存储图中每个节点的操作的Parquet文件 - node_splits:详细记录图中节点分割方式的Parquet文件 - node_feat:包含节点特征的Parquet文件

数据用途概述: 该数据集适用于自然语言处理模型的研究、开发和竞赛。研究人员和开发者可以利用此数据集进行模型配置的比较分析、特征工程和性能评估。此外,数据集还适用于教学和培训,帮助学习者理解NLP模型的内部机制和特征表示方法。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 655.88 MiB
最后更新 2025年6月1日
创建于 2025年6月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。