Anthropic推出史上最强AI模型Mythos,暂不公开发布

瑾年说币14 小时前
短短几周时间,新模型识别出了数千个从未被发现的新漏洞,甚至还自行构建了攻击路径。

原创 | Odaily 星球日报(@OdailyChina) 作者|Azuma(@azuma_eth) Anthropic推出史上最强AI模型Mythos,暂不公开发布

4月8日,Claude背后的AI开发公司Anthropic官方宣布将推出一项名为“玻璃之翼”(Project Glasswing)的新计划,该计划将与亚马逊、苹果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux基金会、微软、英伟达和Palo Alto Networks等多家头部大厂联合推进。

Anthropic表示,这是一项旨在保护全球最关键软件的紧急举措,各方将共同使用Mythos Preview版本来发现并修复当前世界赖以生存的系统中的潜在缺陷。

Anthropic推出史上最强AI模型Mythos,暂不公开发布

所谓Mythos,即Anthropic正在开发的下一代AI模型,这是人类历史上第一个总参数突破十万亿量级的模型(与之相对,当前市面上的主流模型参数量都在数千亿到一万亿级别),训练成本达到了惊人的100亿美元。相较于Claude当前最强大的模型Opus 4.6,Mythos在软件编码、学术推理和网络安全等测试中得分均大幅提高。

关于Mythos的传言上周便已在市场流传,当时市场的普遍担忧是——拥有网络安全特化能力的Mythos是否会影响当前的安全攻防格局?如若被恶意利用,是否会造成更大规模的安全事故?Odaily当时亦曾报道此事,并曾与业界安全专家、慢雾创始人余弦探讨对加密货币行业安全攻防的潜在影响(详见《Odaily专访余弦:Anthropic核弹级新模型泄漏,如何影响加密安全攻防?》),但当时Anthropic方面并未公开承认Mythos的存在,因此相关信息仍然有限。

4月8日,随着“玻璃之翼”计划的公布,Anthropic也披露了更多Mythos的相关细节。基于Anthropic方面公布的实测案例来看,Anthropic对于Mythos的能力并未夸大,以至于该公司甚至不敢直接公开发布该模型,以防被黑客群体恶意利用,而是计划先通过“玻璃之翼”计划让头部大厂试用排查,提前修补潜在漏洞。

Mythos秀肌肉:几周时间,挖出数千个“零日漏洞”

在谈及Mythos的实力时,Anthropic直言表示,该模型的诞生意味着一个严峻的事实已经到来——AI模型的编码能力已经达到了极高的水平,在发现和利用软件漏洞方面,它们几乎可以超越除了最熟练的人类之外的所有人。

根据Anthropic方面的披露,在短短几周时间内,Anthropic使用Mythos识别出了数千个零日漏洞(即此前连软件开发者自身都未曾发现的缺陷),其中许多属于高危漏洞,问题覆盖了所有主流操作系统和主流浏览器,并波及一系列其他关键软件。

Anthropic给出了几个颇具代表性的案例:

Mythos发现了OpenBSD中一个存在27年的漏洞,该系统一直以“极度安全”著称,被广泛用于防火墙等关键基础设施,而这一漏洞允许攻击者远程直接使系统崩溃;

在被大量软件使用的视频处理库FFmpeg中,Mythos找到了一个存在16年的漏洞,该问题所在代码曾被自动化测试触发超过500万次,但始终未被发现;

Mythos还能够将Linux内核中的多个漏洞自动串联,从普通用户权限升级至完全控制服务器。

更令人担忧的是,Anthropic表示这些漏洞大多是Mythos在几乎无人干预的情况下“自主发现并构造利用路径”的,这或许意味着AI已经开始具备类似顶级黑客团队的自动化攻防能力。

在评测基准上,Mythos较Opus 4.6也呈现出了断层级的进化。例如在网络安全漏洞复现测试中,Mythos达到83.1%,而Opus 4.6则为66.6%;在多项编码与推理测试中,Mythos的得分同样实现大幅领先。

Anthropic推出史上最强AI模型Mythos,暂不公开发布

Anthropic推出史上最强AI模型Mythos,暂不公开发布

或许正是因为Mythos的能力过于强大,Anthropic并没有选择直接开放模型,而是先推出了“玻璃之翼”计划,让整个互联网提前“加固”。

通过该计划,Anthropic将向计划参与方提前开放Mythos Preview版本,用于发现并修复其基础系统中的漏洞或弱点——重点聚焦于本地漏洞检测、二进制程序黑盒测试、终端安全加固以及系统渗透测试等任务。

Anthropic还承诺,将向计划参与方提供总计1亿美元的模型使用额度,以支持整个研究预览阶段的使用。此后,Mythos Preview版本将以每百万输入/输出tokens分别25美元/125美元的价格向参与方开放(参与者也可通过Claude API、Amazon Bedrock、Google Cloud Vertex AI以及Microsoft Foundry访问该模型)。除去模型使用额度外,Anthropic还会通过Linux基金会向Alpha-Omega和OpenSSF捐赠250万美元,并向Apache软件基金会捐赠150万美元,以帮助开源软件维护者应对不断变化的安全环境。

Anthropic计划逐步扩大“玻璃之翼”的参与范围,并持续推进数月,同时尽可能分享经验,以便其他组织能够将相关经验应用于自身安全建设。90天内,Anthropic将公开报告阶段性成果,包括已修复的漏洞以及可披露的安全改进措施。

技术只会不断升级,但也无需太过忧心

AI正在不可逆地改变我们所熟悉的这个世界,包括本文所聚焦的网络安全领域。随着漏洞被发现与利用的门槛大幅降低,人们不免会产生担忧,AI是否会成为恶意行为者手中的利刃,威胁现有的网络安全平衡?(PS:对于需要将真金白银置于钱包系统或链上协议的加密货币用户而言,这一担忧会尤其强烈。)

针对这一问题,Anthropic认为“我们仍有理由保持乐观”,AI模型之所以危险,正是因为它们具备在不法分子手中造成危害的能力,但于此同时,AI在发现和修复重要软件缺陷以及开发更安全的新软件方面也具有着不可估量的价值。

可以预见的是,未来几年AI的能力仍将快速进化,但在新的攻击手段出现之时,新的防御机制也会同步涌现。技术升级不可避免,但这并不意味着风险必然失控——只要防御体系同步进化,甚至能够借助AI建立更高强度的安全护城河。

免责声明:

1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险

2.本文版权归属原作所有,仅代表作者本人观点,不代币币情的观点或立场