数据集

跨多社交网络的文本内容身份解析方案数据集

数据集概述

本数据集是基于文本内容的多社交网络身份解析方案研究数据，包含训练集和测试集两部分。核心内容为Twitter源 profile 与Facebook目标 profile 的特征对，标注匹配/非匹配状态，用于身份解析模型的训练与验证。

文件详解

该数据集包含一个压缩包文件，具体说明如下： - 文件名称: Datasets.zip - 文件格式: ZIP (.zip) - 内部包含两类数据集文件（推测为结构化数据格式）： - 训练数据集：含三十一个特征列（Twitter源 profile 与Facebook目标 profile 文本特征）及最后一列匹配/非匹配标注，共三万一千八百八十二条记录 - 测试数据集：结构同训练集，共一万七千三百九十二条记录

适用场景

社交网络身份解析研究：用于训练和验证基于文本内容的跨平台用户身份匹配模型
自然语言处理应用：分析社交网络文本特征在身份关联中的作用
多平台用户行为研究：支持跨社交网络用户身份统一分析场景
数据挖掘算法优化：为跨网络身份解析算法提供实验数据支撑

数据与资源

rcpxp7m3tn-1.zipZIP
1.79 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	1.79 MiB
最后更新	2025年11月29日
创建于	2025年11月29日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。