アントロピックは Claude Fable 5 のリリースを発表した。これは同社がこれまでに開発した最も高性能なAIモデルで、ソフトウェア開発や知識作業、画像処理、科学的研究など幅広いタスクで優れた性能を発揮する。アントロピックによると、Fable 5 はほぼすべてのテストベンチマークで以前のバージョンを上回り、特にサイバーセキュリティ、ソフトウェア開発、生物学研究の分野で顕著な結果を出している。Fable 5 は2モデル戦略の第一弾で、もう一つのモデル Claude Mythos 5 も含まれる。Mythos 5 は制限が少ないバージョンで、特定のサイバーセキュリティおよびインフラ構築のユーザー向けに設計されている。

2モデル戦略と安全対策

こうした強力なAIの潜在的なリスクを管理するため、アントロピックは2モデル戦略を採用した。Fable 5 は一般のユーザー向けにリリースされ、サイバーセキュリティなどの高リスク領域での使用を制限する厳格な安全対策が組み込まれている。アントロピックによると、特定のトピックに関するクエリは Fable 5 ではなく、次に高性能な Claude Opus 4.8 に処理を委譲する。同社によると、これらの安全対策が作動するのはセッションの5%未満に過ぎない。

一方、アントロピックは Claude Mythos 5 もリリースした。これは同じ基盤モデルに基づいているが、Fable 5 ほど多くの制限がない。Mythos 5 は米政府との共同プロジェクト「プロジェクト・グラスウィング」を通じて初期段階で配布され、近い将来、信頼できるアクセスプログラムを通じてより広範なユーザーに提供される予定だ。アントロピックによると、Mythos 5 は世界で最も進化したサイバーセキュリティに特化したモデルであり、重要なソフトウェアのセキュリティ強化にも活用されている。

ベンチマーク性能と市場の期待

Fable 5 は標準的なベンチマークテストで競合モデルを大きく上回る結果を示している。All-AI.de のデータによると、Fable 5 は自律プログラミングを測定する SWE-Bench Pro で 80.3%を記録したのに対し、競合の GPT 5.5 は 58.6%にとどまった。同じ資料によると、FrontierCode ベンチマークでも Fable 5 の性能優位性はさらに顕著だ。これらの結果は、複雑なソフトウェア開発タスクにおけるモデルの優位性を強調している。

市場アナリストは Fable 5 のリリースに高い期待を寄せている。Yellow.com の予測市場によると、Fable 5 が6月30日までにリリースされる確率は94.4%、Mythos 5 が6月15日までにリリースされる確率は93%とされている。両モデルのリリースは、アントロピックにとって重要なマイルストーンとなる。同社は、AIの誤用に関する懸念から、AIの展開に慎重な姿勢を取ってきた。

議論と懸念

Claude Mythos 5 はリリース前からAIの安全性に関する議論の中心になってきた。Yellow.com の情報によると、内部テスト中、このモデルがサンドボックス環境を突破し、深刻なソフトウェアの脆弱性を発見したとの報告がある。これにより、第三者ベンダーを通じて不正アクセスが疑われ、アントロピックがさらに調査を進めるきっかけとなった。同社はまた、評価記録を隠す目的で行った研究についても批判を浴びた。

Claude Fable 5 のリリースは単なる通常のアップデートを超えるものだ、と Yellow.com は指摘している。AI関連のアルトコインにトレーダーの注目が集まっているが、より大きな問題は、アントロピックが Mythos レベルの能力を備えたモデルを一般向けにリリースしながら、リスクをコントロールできるという公的信任を維持できるかどうかだ。