- Published on
Claude Mythos:Anthropic造了一个怪物,然后把它关进了笼子
- Authors
- Name
- 大聪明
- @wooluoo
一个AI找到了隐藏27年的漏洞
2026年4月7日,Anthropic官宣了新一代旗舰模型——Claude Mythos,内部代号Capybara(水豚)。
水豚,自然界中最温顺的动物之一。Anthropic给它起这个名字,大概是一种刻意的反讽——因为这只"水豚"是迄今为止人类造出的最危险的AI之一。
它做了什么?它自主在主流操作系统、浏览器、Linux内核中找到了数千个零日漏洞。其中一个,藏在OpenBSD里27年,无人发现。另一个,在FFmpeg中被触发了500万次,同样无人识别。
更恐怖的是,它可以串联多个漏洞,实现从普通用户到完全控机的提权。
这不是科幻小说。这是2026年4月7日发生的事。
全面碾压:数据说话
先看硬指标:
编码能力(SWE-bench)
| 模型 | 得分 |
|---|---|
| Claude Mythos | 93.9% |
| Claude Opus 4.6 | 80.8% |
| Claude Pro (Mythos版) | 77.8% |
| Claude Pro (Opus 4.6版) | 53.4% |
从80.8%到93.9%,这不是渐进式提升,这是代际跨越。
学术推理(USAMO 2026)
| 模型 | 得分 |
|---|---|
| Claude Mythos | 97.6% |
| Claude Opus 4.6 | 42.3% |
42.3%到97.6%。翻了一倍多。USAMO是美国数学奥林匹克,这个分数意味着Mythos在数学推理上已经接近"完美"。
网络安全(CyberGym)
| 模型 | 得分 |
|---|---|
| Claude Mythos | 83.1% |
| Claude Opus 4.6 | 66.6% |
网络安全能力提升16.5个百分点。结合它自主发现零日漏洞的实际表现,这个分数甚至显得保守。
10万亿参数的巨兽
据估算,Mythos的参数量约10万亿,是Opus 4.6(约1-3万亿)的3到10倍。
这个规模意味着什么?GPT-4时代我们在讨论"千亿参数",现在我们在讨论"十万亿"。模型规模的跃迁已经从"大"变成了"巨大",从"巨大"变成了"我们真的确定能控制它吗?"
然后,Anthropic把它关进了笼子
这才是这个故事里最值得深思的部分。
Claude Mythos不对公众开放。
Anthropic只把它提供给了:
- 12家科技巨头:AWS、Apple、Google、Microsoft等
- 40余家关键基础设施组织
- 90天内没有公开计划
Anthropic的原话是:
能力太强、风险太高,可自主生成漏洞利用代码、构建攻击链,若落入不当主体,威胁全球网络安全。
这是AI历史上第一次,一个公司造出了自己认为太危险而不能发布的模型,然后选择了主动限制。
Project Glasswing:笼子的名字
和Mythos一起发布的,还有Project Glasswing——一个安全监管与防御体系。
Glasswing不是一个产品,更像是一套"AI使用协议"。它联合了AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorgan Chase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks等巨头,目标是为全球最关键的软件提供安全保障。
换句话说:Anthropic知道Mythos的漏洞发现能力是双刃剑,所以他们在发布模型之前,先建了一套防御体系。
先造盾,再造矛。
这个顺序本身,就值得所有AI公司学习。
几个值得思考的问题
1. "不公开"真的安全吗?
Mythos只在12+40家组织手中。但这些组织的安全水平参差不齐。一旦泄露,后果不堪设想。集中保管≠绝对安全。
2. 谁来监督监督者?
Anthropic自己决定"这个模型太危险"。但如果下一个公司不这么决定呢?商业竞争压力下,"安全"往往是第一个被牺牲的。
3. 零日漏洞的发现,应该是公开的还是保密的?
Mythos发现了数千个零日漏洞。这些信息在12家公司手中。其他公司呢?普通用户呢?他们运行的系统里还有这些漏洞,但他们不知道。
4. AI安全的"囚徒困境"
A公司克制了,B公司不克制,B就赢了。这是AI安全的核心悖论——做对的事,可能在商业上吃亏。Anthropic这次选择了做对的事,但这个选择能维持多久?
写在最后
Claude Mythos的发布,标志着一个新阶段:AI能力已经超过了公开发放的安全阈值。
这不是AI寒冬,这是AI的"核时代"。曼哈顿工程造出了原子弹,之后人类花了几十年建立核不扩散体系。AI领域可能也需要类似的机制。
Anthropic做了一件值得尊敬的事:他们造出了"炸弹",然后选择了先建"国际原子能机构",而不是直接卖。
但问题是——下一个Anthropic,会做同样的选择吗?
参考文献:Anthropic官方公告,2026年4月7日