Claude Mythos：Anthropic造了一个怪物，然后把它关进了笼子

一个AI找到了隐藏27年的漏洞

2026年4月7日，Anthropic官宣了新一代旗舰模型——Claude Mythos，内部代号Capybara（水豚）。

水豚，自然界中最温顺的动物之一。Anthropic给它起这个名字，大概是一种刻意的反讽——因为这只"水豚"是迄今为止人类造出的最危险的AI之一。

它做了什么？它自主在主流操作系统、浏览器、Linux内核中找到了数千个零日漏洞。其中一个，藏在OpenBSD里27年，无人发现。另一个，在FFmpeg中被触发了500万次，同样无人识别。

更恐怖的是，它可以串联多个漏洞，实现从普通用户到完全控机的提权。

这不是科幻小说。这是2026年4月7日发生的事。

全面碾压：数据说话

先看硬指标：

编码能力（SWE-bench）

模型	得分
Claude Mythos	93.9%
Claude Opus 4.6	80.8%
Claude Pro (Mythos版)	77.8%
Claude Pro (Opus 4.6版)	53.4%

从80.8%到93.9%，这不是渐进式提升，这是代际跨越。

学术推理（USAMO 2026）

模型	得分
Claude Mythos	97.6%
Claude Opus 4.6	42.3%

42.3%到97.6%。翻了一倍多。USAMO是美国数学奥林匹克，这个分数意味着Mythos在数学推理上已经接近"完美"。

网络安全（CyberGym）

模型	得分
Claude Mythos	83.1%
Claude Opus 4.6	66.6%

网络安全能力提升16.5个百分点。结合它自主发现零日漏洞的实际表现，这个分数甚至显得保守。

10万亿参数的巨兽

据估算，Mythos的参数量约10万亿，是Opus 4.6（约1-3万亿）的3到10倍。

这个规模意味着什么？GPT-4时代我们在讨论"千亿参数"，现在我们在讨论"十万亿"。模型规模的跃迁已经从"大"变成了"巨大"，从"巨大"变成了"我们真的确定能控制它吗？"

然后，Anthropic把它关进了笼子

这才是这个故事里最值得深思的部分。

Claude Mythos不对公众开放。

Anthropic只把它提供给了：

12家科技巨头：AWS、Apple、Google、Microsoft等
40余家关键基础设施组织
90天内没有公开计划

Anthropic的原话是：

能力太强、风险太高，可自主生成漏洞利用代码、构建攻击链，若落入不当主体，威胁全球网络安全。

这是AI历史上第一次，一个公司造出了自己认为太危险而不能发布的模型，然后选择了主动限制。

Project Glasswing：笼子的名字

和Mythos一起发布的，还有Project Glasswing——一个安全监管与防御体系。

Glasswing不是一个产品，更像是一套"AI使用协议"。它联合了AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorgan Chase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks等巨头，目标是为全球最关键的软件提供安全保障。

换句话说：Anthropic知道Mythos的漏洞发现能力是双刃剑，所以他们在发布模型之前，先建了一套防御体系。

先造盾，再造矛。

这个顺序本身，就值得所有AI公司学习。

几个值得思考的问题

1. "不公开"真的安全吗？

Mythos只在12+40家组织手中。但这些组织的安全水平参差不齐。一旦泄露，后果不堪设想。集中保管≠绝对安全。

2. 谁来监督监督者？

Anthropic自己决定"这个模型太危险"。但如果下一个公司不这么决定呢？商业竞争压力下，"安全"往往是第一个被牺牲的。

3. 零日漏洞的发现，应该是公开的还是保密的？

Mythos发现了数千个零日漏洞。这些信息在12家公司手中。其他公司呢？普通用户呢？他们运行的系统里还有这些漏洞，但他们不知道。

4. AI安全的"囚徒困境"

A公司克制了，B公司不克制，B就赢了。这是AI安全的核心悖论——做对的事，可能在商业上吃亏。Anthropic这次选择了做对的事，但这个选择能维持多久？

写在最后

Claude Mythos的发布，标志着一个新阶段：AI能力已经超过了公开发放的安全阈值。

这不是AI寒冬，这是AI的"核时代"。曼哈顿工程造出了原子弹，之后人类花了几十年建立核不扩散体系。AI领域可能也需要类似的机制。

Anthropic做了一件值得尊敬的事：他们造出了"炸弹"，然后选择了先建"国际原子能机构"，而不是直接卖。

但问题是——下一个Anthropic，会做同样的选择吗？

参考文献：Anthropic官方公告，2026年4月7日