セキュリティの訓練をまったく受けていないAnthropic(アンソロピック)のあるエンジニアが、Claude Mythos(クロード・ミトスやクロード・マイソス。またはクロード・ミュトス。もともとギリシア語の「μῦθος」[神話]を意味する)に、一晩でリモートコード実行の脆弱性を見つけるよう頼んだ。翌朝目を覚ますと、完全に動く攻撃手段ができあがっていた。
Anthropicが米国時間4月7日に発表したのは、そういうモデルである。Claude Mythos Previewは、公表されているあらゆるベンチマークで、これまでに作られた中で最も高性能なAIモデルである。SWE-bench Verifiedで93.9%、USAMOで97.6%、CyberGymで83.1%を記録した。主要なすべてのOSと主要なすべてのウェブブラウザーでゼロデイ脆弱性を見つけた。完全に自律的に、人の指示なしでだ。
このモデルを作ったAnthropicの対応は、公開しないことだった。その代わりに同社は、サイバー防衛の取り組みであるProject Glasswing(プロジェクト・グラスウィング)を立ち上げ、このモデルをアマゾン、アップル、グーグル、マイクロソフト、エヌビディア、CrowdStrike(クラウドストライク)、JPモルガン・チェース、シスコ、ブロードコム、Palo Alto Networks(パロアルトネットワークス)、Linux Foundation(リナックス財団)に提供した。さらに、重要なソフトウェア基盤を支える約40の組織にもアクセス権が与えられる。Anthropicは、利用クレジット1億ドル(約159億円。1ドル=159円換算)と、オープンソースのセキュリティ関連団体への直接寄付400万ドル(約6億3600万円)を拠出する。
主要なAI研究企業が最先端モデルを開発しながら、同時に一般には使わせないと決めたのは、これが初めてだ。



