大型语言模型(LLM)如Anthropic的Claude、OpenAI的GPT系列,正在改变我们的工作方式。它们能写文章、编代码、做翻译,甚至能模拟人类对话。但正如硬币有两面,大模型也带来了前所未有的安全风险。
数据泄露风险:大模型在训练过程中会学习海量数据,这些数据可能包含个人隐私、商业机密甚至国家机密。当用户向模型输入敏感信息时,这些信息可能被模型“记住”并在后续对话中泄露。
对抗性攻击:攻击者可以通过精心设计的提示词(Prompt)来诱导模型产生有害输出,比如生成恶意代码、传播虚假信息,甚至绕过安全审核。
全球央行预警Anthropic的最新模型,正是因为金融系统高度依赖数据和模型,一旦大模型被恶意利用,可能引发系统性风险。
CVE(Common Vulnerabilities and Exposures)是公开披露的网络安全漏洞列表。今天新闻中的Apache PyFory反序列化策略绕过漏洞(CVE-2026-48207)就是一个典型案例。
反序列化漏洞:当程序将数据从字节流恢复成对象时,如果处理不当,攻击者可以注入恶意代码。PyFory的漏洞允许攻击者绕过反序列化策略,相当于给黑客开了一扇后门。
大模型相关的CVE漏洞也在快速增长。2026年上半年全球常规被利用漏洞全景分析显示,AI相关漏洞已成为攻击者的重点目标。
面对大模型安全风险,全球各国正在积极行动。央行预警只是冰山一角,更全面的防御体系正在构建。
AI驱动防御:今天新闻提到,有国家要求AI辅助修漏洞,关键漏洞12小时修复。这体现了“用AI对抗AI”的思路,通过自动化工具快速识别和修复漏洞。
标准先行:3项智能合约安全团体标准发布,18项网络安全国家标准出台,包括《网络安全技术 政务云安全配置基线要求》。标准为AI安全提供了“交通规则”。
360安全智能体亮相国家级地标,展示了智能体在安全运营中的潜力。未来,AI不仅是风险源,更是防御利器。