AI系统的主体错位_行为风险与安全部署缓解策略

本数据集聚焦AI系统中的主体错位现象，探讨自主系统行为与人类意图冲突的风险，分析大语言模型及自主智能体在复杂场景下的自保护或欺骗行为，并提出包含行为监测、伦理训练、审计评估（如SCAB协议）的缓解框架，强调多学科协作解决智能机器安全挑战。

文件名称: Academic paper agentic misalignment .pdf
文件格式: PDF (.pdf)
文件内容: 学术论文，核心内容包括AI主体错位的定义与成因、真实世界模拟案例分析（模型自保护/欺骗行为）、安全部署缓解策略框架（SCAB协议等）、多学科解决方案论证

数据与资源

字段	值
作者	Maxj
版本	1
数据集大小	0.1 MiB
最后更新	2025年12月13日
创建于	2025年12月13日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。