AI

2026.06.10 15:00

アンソロピック、一般公開版「Claude Mythos」リリース 大幅な安全対策が追加

sauloangelo - stock.adobe.com

sauloangelo - stock.adobe.com

Anthropic(アンソロピック)は米国時間6月9日、大きな期待と強い警戒の両方を集めてきたClaude Mythosモデルの初の一般公開版となる「Claude Fable 5」をリリースした。同モデルには、サイバーセキュリティ上の脆弱性の悪用や生物兵器の開発に利用されることを防ぐセーフティガード(安全制御機能)が組み込まれている。

advertisement

同社はまた、さらに強力なモデル「Claude Mythos 5」を、すでにClaude Mythos Previewへのアクセスを有していた「少数のサイバー防御関係者およびインフラ事業者」向けにリリースすると発表した。

アンソロピックは、この2つの新モデルがソフトウェアエンジニアリング、財務分析などのナレッジワーク、そして「視覚」と「ロングコンテキスト」(長大な文脈情報の処理)を必要とするタスクにおいて優れていると主張している。

同社は、より高度なモデルへの「アクセスを段階的に拡大」するため米政府と協力していると述べた。同モデルは「世界のあらゆるモデルの中で最強のサイバーセキュリティ能力」を持つと同社は主張している。

advertisement

Claude Fable 5とMythos 5の価格は、入力100万トークン(AIが処理するテキストの単位)あたり10ドル(約1600円)、出力100万トークンあたり25ドル(約4000円)に設定される。これは現在提供されているアンソロピックの最上位モデルClaude Opusのおよそ2倍の価格だが、それでもClaude Mythos Previewの提供価格の半分以下である。

Claude Fableの安全対策はどう機能するのか

アンソロピックによると、Claude Fableには、潜在的に有害な情報へアクセスする目的でモデルを「ジェイルブレイク」(安全制限の回避)しようとする試みなどの、不正利用を検知する新しいシステムが搭載された状態でリリースされる。

アンソロピックが「分類器(クラシファイア)」と呼ぶこれらのシステムは、特定のトピックに関する質問を検知すると、代わりにClaude Opusへ振り向けるという仕組みで動作する。分類器の対象には、Claudeを「エージェント型ハッキング」(AIが自律的に実行するハッキング)に利用しようとする試みを含むサイバーセキュリティに関する質問のほか、生物兵器の開発につながりかねない生物学・化学に関する一部の質問が含まれる。

3つ目の分類器は、アンソロピックが「蒸留」(ディスティレーション)と呼ぶもの、すなわちClaudeを利用して競合AIモデルを構築しようとする試みに対応する。

アンソロピックは数カ月にわたり、この新モデルに関する情報を小出しにしてきた。4月に発表したものの、セキュリティ上の懸念から一般公開は見送り、代わりにサイバーセキュリティ上の脆弱性を特定する目的で、Project Glasswingを通じてアップル、マイクロソフト、グーグルなどのテック企業グループに一部バージョンを提供することを選択していた。

アンソロピックがMythosを一般公開したのは、新規株式公開(IPO)を非公開で申請してからわずか1週間余り後のことだ。同社は年内の上場を目指していると報じられており、5月の資金調達ラウンドを経て、現在の評価額は9650億ドル(約155兆円)に達している。

forbes.com 原文

翻訳=酒匂寛

タグ:

advertisement

ForbesBrandVoice

人気記事