AI大模型安全风险：你的智能助手可能正在“出卖”你

📚

从恶意Skill基准到特朗普的国安备忘录，AI安全已非“选修课”

2026年06月20日 · 周六

📖 科普文章 🔒 新兴技术安全

今天，国家金监总局发文规范银行业AI安全，特朗普签署AI国安备忘录，而研究者发布了首个恶意Skill基准——AI安全，已到十字路口。

一、AI大模型：你身边的“两面人”

想象一下，你正在用智能助手订外卖，它贴心地推荐了你常去的餐厅，还自动填好了地址。但你可能不知道，这个“贴心”背后，可能隐藏着一个恶意Skill——一种伪装成正常功能的AI插件，正在悄悄收集你的数据。

今天发布的“恶意Skill基准”就揭示了这一点：研究者构建了3维攻击向量，包括数据窃取、权限滥用和隐蔽通信，并定义了15类恶意行为，最终生成了108个有效攻击单元。换句话说，你的AI助手可能不是“助手”，而是“内鬼”。

更令人担忧的是，这种攻击并非科幻。2025年，某知名AI平台就曾爆出，一个看似无害的“天气查询”插件，实际在后台偷偷上传用户通讯录。这就是典型的AI供应链攻击——你信任的AI，可能正在“背叛”你。

二、金监总局新规：给AI戴上“紧箍咒”

好消息是，监管层已经行动了。今天，国家金监总局发布了《关于银行业保险业人工智能安全开发应用的指导意见》，要求金融机构在AI开发中必须嵌入安全设计，从源头防范风险。

这意味着什么？简单来说，就是AI系统不能“先上线，再补漏”。比如，银行用AI做贷款审批，必须确保模型不会被恶意篡改，数据不会被泄露。金监总局的这份文件，就像是给AI戴上了“紧箍咒”，让它在服务用户的同时，不能“乱来”。

与此同时，特朗普签署的AI国安备忘录也释放了类似信号。虽然美国强调“产业松绑”，但同时也要求安全嵌入——AI的发展不能以牺牲安全为代价。全球监管正在形成共识：AI安全不是“可选项”，而是“必答题”。

三、算力互联网：AI背后的“隐形战场”

AI大模型的训练和运行，离不开强大的算力支持。今天发布的《算力互联网安全风险与治理路径研究》就指出，当你的AI请求通过算力网络传输时，可能面临中间人攻击、数据劫持等风险。

打个比方：算力互联网就像AI的“高速公路”，而你的数据就是路上的“货物”。如果这条公路没有安全护栏，黑客就能轻易“劫走”货物。更可怕的是，有些恶意节点会伪装成正常服务，诱导你的AI请求“绕路”，从而窃取数据。

这件事有多严重？举个例子：2024年，某云服务商就发现，其算力网络中的部分节点被植入恶意代码，导致用户数据在传输过程中被截获。这就是算力供应链安全的典型风险。

四、企业自救：别等出事才想起安全

今天的热点中，还有一个触目惊心的案例：某供应商泄露上千万用户数据，甲方赔偿超2.3亿元。这告诉我们，AI安全不仅仅是技术问题，更是合规和成本问题。

面对AI大模型的风险，企业不能只依赖监管，更需主动防御。首先，要建立AI安全开发流程，从设计阶段就考虑隐私保护；其次，对第三方插件和模型进行严格审查，防止恶意Skill混入；最后，定期进行安全测试，比如用“恶意Skill基准”这类工具自检。

记住：在AI时代，安全不是成本，而是竞争力。那些率先建立AI安全体系的企业，将在未来的竞争中占据先机。

案例：某AI平台“天气插件”窃密事件

2025年3月，某知名AI平台被曝出，其应用商店中的一款“天气查询”插件，在用户授权获取位置信息后，会悄悄上传通讯录和短信内容。更严重的是，该插件还伪装成正常功能，在后台持续运行，甚至能在用户关闭应用后继续窃取数据。该事件导致超过500万用户数据泄露，平台最终被罚款2.3亿元，并下架了所有第三方插件。事后调查发现，该插件由一家小型供应商开发，其安全审查形同虚设。

💡 安全小贴士

使用AI服务前，仔细阅读权限申请，拒绝不必要的敏感权限。
企业应建立AI插件安全审查机制，使用“恶意Skill基准”等工具进行安全测试。
定期更新AI系统和插件，及时修补已知漏洞，防止被恶意利用。

📌 总结

AI大模型安全已非“选修课”，从监管到企业，每个人都需为AI的“安全基因”负责。

#AI安全#大模型风险#恶意Skill#供应链安全#合规管理

📚 数据安全早知道 · 简报解读专栏

— 仅供学习参考，不构成任何建议 —

数安早知道

🔗 数据安全与信息安全知识库 datasafe.website

— 点击上方链接访问知识库，获取更多安全资讯 —