📚
AI大模型安全风险:你的智能助手可能正在“出卖”你
从恶意Skill基准到特朗普的国安备忘录,AI安全已非“选修课”
2026年06月20日 · 周六
📖 科普文章 🔒 新兴技术安全
今天,国家金监总局发文规范银行业AI安全,特朗普签署AI国安备忘录,而研究者发布了首个恶意Skill基准——AI安全,已到十字路口。

一、AI大模型:你身边的“两面人”

想象一下,你正在用智能助手订外卖,它贴心地推荐了你常去的餐厅,还自动填好了地址。但你可能不知道,这个“贴心”背后,可能隐藏着一个恶意Skill——一种伪装成正常功能的AI插件,正在悄悄收集你的数据。

今天发布的“恶意Skill基准”就揭示了这一点:研究者构建了3维攻击向量,包括数据窃取、权限滥用和隐蔽通信,并定义了15类恶意行为,最终生成了108个有效攻击单元。换句话说,你的AI助手可能不是“助手”,而是“内鬼”。

更令人担忧的是,这种攻击并非科幻。2025年,某知名AI平台就曾爆出,一个看似无害的“天气查询”插件,实际在后台偷偷上传用户通讯录。这就是典型的AI供应链攻击——你信任的AI,可能正在“背叛”你。

二、金监总局新规:给AI戴上“紧箍咒”

好消息是,监管层已经行动了。今天,国家金监总局发布了《关于银行业保险业人工智能安全开发应用的指导意见》,要求金融机构在AI开发中必须嵌入安全设计,从源头防范风险。

这意味着什么?简单来说,就是AI系统不能“先上线,再补漏”。比如,银行用AI做贷款审批,必须确保模型不会被恶意篡改,数据不会被泄露。金监总局的这份文件,就像是给AI戴上了“紧箍咒”,让它在服务用户的同时,不能“乱来”。

与此同时,特朗普签署的AI国安备忘录也释放了类似信号。虽然美国强调“产业松绑”,但同时也要求安全嵌入——AI的发展不能以牺牲安全为代价。全球监管正在形成共识:AI安全不是“可选项”,而是“必答题”。

三、算力互联网:AI背后的“隐形战场”

AI大模型的训练和运行,离不开强大的算力支持。今天发布的《算力互联网安全风险与治理路径研究》就指出,当你的AI请求通过算力网络传输时,可能面临中间人攻击、数据劫持等风险。

打个比方:算力互联网就像AI的“高速公路”,而你的数据就是路上的“货物”。如果这条公路没有安全护栏,黑客就能轻易“劫走”货物。更可怕的是,有些恶意节点会伪装成正常服务,诱导你的AI请求“绕路”,从而窃取数据。

这件事有多严重?举个例子:2024年,某云服务商就发现,其算力网络中的部分节点被植入恶意代码,导致用户数据在传输过程中被截获。这就是算力供应链安全的典型风险。

四、企业自救:别等出事才想起安全

今天的热点中,还有一个触目惊心的案例:某供应商泄露上千万用户数据,甲方赔偿超2.3亿元。这告诉我们,AI安全不仅仅是技术问题,更是合规和成本问题

面对AI大模型的风险,企业不能只依赖监管,更需主动防御。首先,要建立AI安全开发流程,从设计阶段就考虑隐私保护;其次,对第三方插件和模型进行严格审查,防止恶意Skill混入;最后,定期进行安全测试,比如用“恶意Skill基准”这类工具自检。

记住:在AI时代,安全不是成本,而是竞争力。那些率先建立AI安全体系的企业,将在未来的竞争中占据先机。

案例:某AI平台“天气插件”窃密事件
2025年3月,某知名AI平台被曝出,其应用商店中的一款“天气查询”插件,在用户授权获取位置信息后,会悄悄上传通讯录和短信内容。更严重的是,该插件还伪装成正常功能,在后台持续运行,甚至能在用户关闭应用后继续窃取数据。该事件导致超过500万用户数据泄露,平台最终被罚款2.3亿元,并下架了所有第三方插件。事后调查发现,该插件由一家小型供应商开发,其安全审查形同虚设。
💡 安全小贴士
  • 使用AI服务前,仔细阅读权限申请,拒绝不必要的敏感权限。
  • 企业应建立AI插件安全审查机制,使用“恶意Skill基准”等工具进行安全测试。
  • 定期更新AI系统和插件,及时修补已知漏洞,防止被恶意利用。
📌 总结
AI大模型安全已非“选修课”,从监管到企业,每个人都需为AI的“安全基因”负责。
#AI安全#大模型风险#恶意Skill#供应链安全#合规管理
📚 数据安全早知道 · 简报解读专栏
— 仅供学习参考,不构成任何建议 —
数安早知道
🔗 数据安全与信息安全知识库 datasafe.website
— 点击上方链接访问知识库,获取更多安全资讯 —