米国時間6月9日、Anthropic(アンソロピック)はMythos級初の一般提供モデルとなる「Claude Fable 5」をリリースした。Mythosは安全性の面で市場への投入が長らく保留されていたモデルだ。
直近の、米国の5万社超の法人カード・請求書データに基づく2026年5月のRamp AIインデックスによると、アンソロピックの企業導入率は34.4%であり、OpenAIの32.3%を上回っている。
Claude Fable 5の注目すべき6つの能力を挙げる。
1. コード生成の可能性を塗り替える
Fable 5は、実際のソフトウェア開発業務を測定するベンチマークであるSWE-bench Proで80.3%を記録した。Opus 4.8は69.2%、GPT-4は58.6%にとどまる。問題が長くなるほど、その差は広がる。
StripeはFable 5を使い、5000万行のコードベースの移行を1日で完了させた。本来ならチームで2カ月を要する作業だ。このモデルはもはや、タスクをモデルが処理可能なサイズに分割する必要がない。プロジェクト全体を把握したまま自律的に計画を立て、数時間から数日にわたって稼働し続け、自らの成果を検証する。
2. 思考が破綻しない長時間の推論
従来のモデルが長い推論の連鎖で壁に突き当たったのに対し、Fable 5は広範囲におよぶ問題でも推論を持続させる。具体的には、法務タスクの完遂率はGPT-5.5の2.1%に対して13.3%に達し、ツールを併用した学際的推論では64.5%、生物学では人間が解決済みのタスクで83.9%を記録した。
これは契約書分析、財務監査、科学研究、医療推論といった知識集約型の業務を運用するすべての人にとって重要だ。このモデルは負荷がかかってもハルシネーション(もっともらしい誤情報の生成)を起こさず、数千トークンにわたって精度を積み上げていく。
3. ループを確実に閉じるエージェントの自律性
Fable 5は、ステップ間に人間の介入を挟むことなく計画・実行・検証を行うエージェントを駆動する。クラウドストレージ企業のBox(ボックス)は、同モデルを自社のエージェントに組み込み、財務文書、契約書、ライフサイエンス研究の分野で直ちに活用するとしている。このモデルは文脈を深く理解しているため、自らの誤りに気づき、必要に応じて後戻りし、方針を変更した理由を説明することができる。
自律型ワークフローの導入を進めるチームにとって、これは試験運用と実務への本格導入を分ける決定的な差異となる。
4. 視覚と知識労働の統合
本モデルは、最先端の視覚能力と知識推論を組み合わせている。知識労働(GDPval-AA)のスコアは1932で、Opusの1890を上回る。視覚(GDPdf)は29.8%に達する。この組み合わせは、文書処理や科学論文の分析をはじめ、視覚情報を読み取りながら同時に意味内容を抽出する必要のあるあらゆるタスクで重要となる。このモデルはグラフを読み違えたり、密度の高いレイアウトに埋もれた細部を見落としたりしない。



