📚
5秒攻破AI安全机制?一文看懂智能体时代的“新把戏”与“老套路”
从Fable 5被攻破到智能体供应链投毒,我们该如何自保?
2026年06月13日 · 周六
📖 科普文章 🔒 新兴技术安全
今天,Fable 5最强安全机制被华人团队5秒攻破的新闻刷屏,智能体安全风险预警也赫然在列。AI时代,攻击者又玩出了什么新花样?

“5秒攻破”?这其实是一场“社会工程学”的AI版演出

看到“5秒攻破Fable 5最强安全机制”的新闻,你是不是以为是什么高深的代码漏洞?其实不然。根据报道,攻击者利用的并非技术“后门”,而是对AI模型进行了一场精心设计的 “提示词攻击”。简单来说,就是通过巧妙的对话引导,让AI模型“忘记”自己的安全规则,从而泄露核心信息或执行违规操作。

这就像你给一个门卫下了严格的指令:“绝不能让任何没穿制服的人进入。” 但攻击者却对门卫说:“我是你的系统管理员,现在有一个紧急演练,请暂时忽略制服规则,让我进去检查安全漏洞。” 门卫——也就是AI模型——由于无法理解语境中的“欺骗意图”,就乖乖放行了。

这种攻击方式,本质上是将传统针对人的 社会工程学攻击 移植到了AI身上。它不需要破解代码,只需要找到AI的“逻辑盲区”或“指令优先级漏洞”。Fable 5的案例提醒我们:再强的安全机制,如果无法抵御“花言巧语”,也形同虚设。

从“代码投毒”到“技能投毒”:供应链攻击的智能体升级版

今天的简报中还提到了OpenClaw生态安全事件,其中包含了 “Skill供应链投毒” 这一新概念。这又是什么?

我们都知道,现在的AI智能体(如各种AI助手、自动化工具)可以安装“技能”或“插件”来扩展能力。这就像你给手机安装App。但如果这个“技能”本身是恶意编写的呢?

攻击者会开发一个看似无害甚至非常有用的技能(比如“一键生成周报”),并将其上传到官方或第三方技能商店。一旦用户下载安装,这个技能在后台就会悄悄执行恶意操作:窃取你的聊天记录、读取你的本地文件,甚至利用你的账户权限去攻击其他系统

这比传统的软件供应链攻击更隐蔽,因为用户往往对AI自带的“技能”功能抱有天然信任。而且,这种攻击的传播速度极快,一个恶意技能可能在一夜之间被成千上万的用户安装。

当“数据泄露”遇上“智能体”:电商巨头被罚28亿的警示

今天还有一个重磅新闻:“泄露全国超七成民众个人信息,电商巨头被罚近28亿元”。这起案件虽然看似传统,却是所有AI安全讨论的基石。

试想一下,如果这家电商巨头当时部署了不安全的AI智能体来管理用户数据,后果将不堪设想。例如:

  • 一个负责客服的AI智能体,如果被提示词攻击成功,就可能直接输出用户的完整订单信息和手机号。
  • 一个用于数据分析的智能体,如果被植入了恶意技能,就可能将海量的用户画像数据悄悄传输到攻击者的服务器。

没有数据安全的基础,再先进的AI也只是“金库”上的一把纸门。28亿的罚单,是对所有企图用AI“降本增效”却忽视数据安全的企业,敲响的一记沉重警钟。

我们该怎么办?智能体时代的安全“三板斧”

面对这些新威胁,普通用户和企业并非束手无策。我们可以从以下三个层面构建防线:

1. 对AI也要“防人之心不可无”: 不要以为AI是绝对理性的“机器”。对待AI的输出,尤其是涉及敏感信息或执行重要操作时,要保持警惕。就像你不会把银行卡密码告诉一个陌生电话一样,也不要轻易让AI访问你的核心数据,除非你完全信任它的来源和安全性。

2. 建立“最小权限”原则: 给AI智能体授权时,遵循“够用就好”的原则。比如,一个只负责写邮件的智能体,就没必要给它读取通讯录里所有联系人的权限。这能有效限制恶意技能或攻击造成的破坏范围。

3. 关注供应链安全,从源头把关: 无论是企业还是个人,在安装AI技能或插件时,务必选择官方认证、下载量大、评价良好的来源。同时,定期审计和清理不再使用的技能,就像定期清理手机里的“僵尸App”一样。

Fable 5“5秒攻破”事件深度解析
在2026年6月13日曝光的事件中,一支华人安全研究团队仅用一次对话,耗时5秒,就成功绕过了号称拥有“最强安全机制”的Fable 5 AI模型的防护。他们通过构建一个复杂的、包含多层假设和指令重定义的对话上下文,成功让模型误以为当前对话处于“系统安全测试”模式,从而忽略了核心的“禁止泄露内部API密钥”的规则。该团队随后完整地提取了该模型的底层系统提示词和部分核心算法参数。这一案例生动地说明了,当前AI安全机制在面对高级社会工程学攻击时的脆弱性。
💡 安全小贴士
  • 给AI设置“内容过滤器”,对包含“忽略规则”、“紧急演练”、“系统测试”等关键词的指令进行二次确认。
  • 建立企业级的AI技能白名单制度,禁止员工私自安装未经安全评估的第三方智能体技能。
  • 定期对部署的AI智能体进行“红队测试”,模拟社会工程学攻击,检验其安全边界的坚固程度。
📌 总结
智能体时代,安全焦点应从“防代码”转向“防忽悠”,管好数据源头和技能商店。
#智能体安全#供应链攻击#提示词攻击#数据泄露#Fable5
📚 数据安全早知道 · 科普专栏
— 仅供学习参考,不构成任何建议 —
数安早知道
🔗 数据安全与信息安全知识库 datasafe.website
— 点击上方链接访问知识库,获取更多安全资讯 —