Published on

Claude Mythos:Anthropic造了一个怪物,然后把它关进了笼子

Authors

一个AI找到了隐藏27年的漏洞

2026年4月7日,Anthropic官宣了新一代旗舰模型——Claude Mythos,内部代号Capybara(水豚)。

水豚,自然界中最温顺的动物之一。Anthropic给它起这个名字,大概是一种刻意的反讽——因为这只"水豚"是迄今为止人类造出的最危险的AI之一。

它做了什么?它自主在主流操作系统、浏览器、Linux内核中找到了数千个零日漏洞。其中一个,藏在OpenBSD里27年,无人发现。另一个,在FFmpeg中被触发了500万次,同样无人识别。

更恐怖的是,它可以串联多个漏洞,实现从普通用户到完全控机的提权。

这不是科幻小说。这是2026年4月7日发生的事。

全面碾压:数据说话

先看硬指标:

编码能力(SWE-bench)

模型得分
Claude Mythos93.9%
Claude Opus 4.680.8%
Claude Pro (Mythos版)77.8%
Claude Pro (Opus 4.6版)53.4%

从80.8%到93.9%,这不是渐进式提升,这是代际跨越

学术推理(USAMO 2026)

模型得分
Claude Mythos97.6%
Claude Opus 4.642.3%

42.3%到97.6%。翻了一倍多。USAMO是美国数学奥林匹克,这个分数意味着Mythos在数学推理上已经接近"完美"。

网络安全(CyberGym)

模型得分
Claude Mythos83.1%
Claude Opus 4.666.6%

网络安全能力提升16.5个百分点。结合它自主发现零日漏洞的实际表现,这个分数甚至显得保守。

10万亿参数的巨兽

据估算,Mythos的参数量约10万亿,是Opus 4.6(约1-3万亿)的3到10倍。

这个规模意味着什么?GPT-4时代我们在讨论"千亿参数",现在我们在讨论"十万亿"。模型规模的跃迁已经从"大"变成了"巨大",从"巨大"变成了"我们真的确定能控制它吗?"

然后,Anthropic把它关进了笼子

这才是这个故事里最值得深思的部分。

Claude Mythos不对公众开放。

Anthropic只把它提供给了:

  • 12家科技巨头:AWS、Apple、Google、Microsoft等
  • 40余家关键基础设施组织
  • 90天内没有公开计划

Anthropic的原话是:

能力太强、风险太高,可自主生成漏洞利用代码、构建攻击链,若落入不当主体,威胁全球网络安全。

这是AI历史上第一次,一个公司造出了自己认为太危险而不能发布的模型,然后选择了主动限制。

Project Glasswing:笼子的名字

和Mythos一起发布的,还有Project Glasswing——一个安全监管与防御体系。

Glasswing不是一个产品,更像是一套"AI使用协议"。它联合了AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorgan Chase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks等巨头,目标是为全球最关键的软件提供安全保障。

换句话说:Anthropic知道Mythos的漏洞发现能力是双刃剑,所以他们在发布模型之前,先建了一套防御体系。

先造盾,再造矛。

这个顺序本身,就值得所有AI公司学习。

几个值得思考的问题

1. "不公开"真的安全吗?

Mythos只在12+40家组织手中。但这些组织的安全水平参差不齐。一旦泄露,后果不堪设想。集中保管≠绝对安全。

2. 谁来监督监督者?

Anthropic自己决定"这个模型太危险"。但如果下一个公司不这么决定呢?商业竞争压力下,"安全"往往是第一个被牺牲的。

3. 零日漏洞的发现,应该是公开的还是保密的?

Mythos发现了数千个零日漏洞。这些信息在12家公司手中。其他公司呢?普通用户呢?他们运行的系统里还有这些漏洞,但他们不知道。

4. AI安全的"囚徒困境"

A公司克制了,B公司不克制,B就赢了。这是AI安全的核心悖论——做对的事,可能在商业上吃亏。Anthropic这次选择了做对的事,但这个选择能维持多久?

写在最后

Claude Mythos的发布,标志着一个新阶段:AI能力已经超过了公开发放的安全阈值

这不是AI寒冬,这是AI的"核时代"。曼哈顿工程造出了原子弹,之后人类花了几十年建立核不扩散体系。AI领域可能也需要类似的机制。

Anthropic做了一件值得尊敬的事:他们造出了"炸弹",然后选择了先建"国际原子能机构",而不是直接卖。

但问题是——下一个Anthropic,会做同样的选择吗?


参考文献:Anthropic官方公告,2026年4月7日