数据集概述
本数据集围绕协作系统中LLM生成角色的知识管理框架构建,包含源代码压缩包、LLM生成意见的相似度分析、清洗数据、嵌入数据、原始数据以及真实意见数据等6个文件,覆盖原始、处理后等不同形态的角色相关数据,支持对LLM生成角色与真实角色意见的对比分析。
文件详解
- Source-Code.zip
- 文件格式:ZIP
- 字段映射介绍:包含数据集相关的源代码压缩文件
- LLM-Generated_opinions_similarity.csv
- 文件格式:CSV
- 字段映射介绍:包含NAME(名称)、DOCUMENT_EMBEDDING_REAL(真实文档嵌入)、DOCUMENT_EMBEDDING_SIMULATED(模拟文档嵌入)、DOCUMENT_SIMILARITY(文档相似度)、KEYWORDS_EMBEDDING_REAL(真实关键词嵌入)、KEYWORDS_EMBEDDING_SIMULATED(模拟关键词嵌入)、KEYWORDS_SIMILARITY(关键词相似度)等字段
- LLM-Generated_opinions_clean.csv
- 文件格式:CSV
- 字段映射介绍:包含NAME(名称)、INFO(信息)、TYPE(类型)、SOURCE(来源)、TEXT(文本)等字段
- Real Opinions.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含真实意见相关数据的表格文件
- LLM-Generated_opinions_embedding.csv
- 文件格式:CSV
- 字段映射介绍:包含LLM生成意见嵌入数据的表格文件
- LLM-Generated_opinions_raw.xml
- 文件格式:XML
- 字段映射介绍:包含LLM生成意见原始数据的XML文件
适用场景
- 知识管理框架研究:用于构建协作系统中LLM生成角色的知识管理框架,探索角色数据的组织与应用模式
- LLM生成内容分析:对比分析LLM生成角色意见与真实意见的相似度、嵌入特征差异
- 协作系统角色建模:基于真实与LLM生成的角色数据,优化协作系统中的角色模拟与交互逻辑
- 文本数据处理研究:利用原始、清洗、嵌入等不同形态的文本数据,开展自然语言处理相关技术研究