AI規制ドミノの始まり

Anthropicの戦略とその影響

背景として、AnthropicはAIモデルを開発する企業です。これは、業界では周知の事実かもしれません。Anthropicは数ヶ月前からMythosという新しいモデルを宣伝していました。Mythosは元々高品質なコーディングモデルで、ここ数ヶ月AIが行っているようにコードを書くのが非常に得意でした。しかし、Mythosはコーディングだけでなく、サイバーセキュリティ研究にも非常に優れていることが判明しました。特に、ソフトウェアの脆弱性を見つけ、それらを組み合わせて完全なエンドツーエンドのエクスプロイトを書くことができました。

この社会に対する危険性を考慮し、AnthropicはMythosを特定の企業だけが利用できるモデルにすることを決定しました。これを「Project Glasswing」と呼び、Apple、Microsoft、Amazonなど、世界のインフラを支えるコードの大部分を作成する企業にアクセスを提供しました。

これらの企業がMythosを内部で使用して自社のソフトウェアのバグを見つけることができれば、世界をより安全な場所にすることができるという考えです。Mythosは非常に優れたコーディングモデルであったため、多くの人々がこの世界クラスのモデルを求めました。

最終的にAnthropicはMythosを「Fable 5」という別の名前で公開しましたが、ガードレールという厳しい制限が設けられていました。この制限は、特定の方法での使用を防ぐものです。例えば、セキュリティ研究者がFable 5をサイバーセキュリティ研究に使用しようとし、「Ghidra MCP※に接続して何かできる？」と質問した際、その質問をするだけで制限が発動し、モデルがOpus 4.8という、より弱いモデルにダウングレードされました。

※Ghidra MCP（Model Context Protocol）は、アメリカ国家安全保障局（NSA）が開発したツールで、Ghidraの強力なリバースエンジニアリング機能を現代のAIツールや自動化フレームワークと連携させるために使用されます。MCPは、249のツールや実績のあるAIワークフローを提供し、Pコードのエミュレーション、ライブデバッガーの統合、Pコードグラフのデータフロー解析を含む、最も包括的なGhidra MCP統合を実現しています。これにより、ソフトウェアの動作を詳細に理解し、効果的な対策を立てることが可能になります。技術的な知識がなくても、ソフトウェアの動きを追跡し、潜在的な問題を防ぐ手助けをしてくれます。

どうやら、Amazonの研究者たちが、ガードレール付きのFableモデルを使ってセキュリティ研究を行うためのジェイルブレイク※を発見したようです。つまり、Anthropicが設けたルールを回避し、それによって事実上、一般に公開されたMythos同様のモデルにしてしまったということです。

※ジェイルブレイクとは、デバイスやソフトウェアに設けられた制限や保護を解除することを指します。これにより、通常はアクセスできない機能や設定を利用できるようになります。

政府の介入とその影響

これにより、アメリカ政府が介入し、Fable 5とMythos 5へのアクセスを停止するよう指示しました。米国内外を問わず、外国籍の個人、または外国籍のAnthropicの従業員によるFable 5とMythos 5へのすべてのアクセスを停止するという輸出管理指令を発行しました。

この命令を受け、Anthropicはすべての顧客に対してFable 5とMythos 5を急遽無効にし、コンプライアンスを確保しました。他のAnthropicモデルへのアクセスは影響を受けていません。

参考：https://www.anthropic.com/news/fable-mythos-access

基本的に、政府は、世界中の外国人がこのジェイルブレイクを通じてFable 5にアクセスできる場合、Mythosにもアクセスできると考えています。外国人がエクスプロイトを作成できるため、国家安全保障の脅威となります。このモデルを使用できないようにする必要があります。Anthropicは、プラットフォーム上にいるユーザーが米国市民であるかどうかを判断するすべを持っていないため、唯一の方法はそれを無効にすることです。

これにはいくつかの理由で問題があります。これから理由を説明いたしますが、どのテスターも、モデルの安全策を広範囲に回避し、モデルの全能力を解放するような普遍的なジェイルブレイク方法を見つけることができていません。

Amazonのジェイルブレイクは、特定の種類のことを行うことしかできませんでした。Mythosをジェイルブレイクしてそのまま全能力を使用することはできませんでした。これが悪い理由の一つです。ここからは、単なる前例の観点と潜在的な立法の観点から、これが非常に悪いと思う理由を述べます。私がここで懸念しているのは、サイバーセキュリティ研究を行うためにMythosを必要としないということです。

代替モデルとその可能性

Opus 4.7とGhidra MCPを使用してゼロデイエクスプロイトを見つけている人々もいます。さらに、MicrosoftのMDASHのように、Mythosを使用せずにMythosを上回る性能を発揮するモデルがあることが、Cybergym.ioのベンチマークで証明されています。

参考：https://www.cybergym.io/cybergym/

また、GPT-5.5というMythosではないモデルも、輸出管理指令を受けていないにもかかわらず、一般的にMythosと同じレベルのパフォーマンスを発揮します。私がドミノという言葉を使ったのは、まさにそのドミノが倒れ始めたと考えているからです。政府がMythosの言葉の使われ方に気づくか、Mythosが世界クラスのエクスプロイト開発者であるというのがマーケティング上の表現にすぎないと理解した場合、実際には他のモデルでもこの種の研究を行うことができるということです。

未来への懸念

サイバーセキュリティの研究をしたい人が、これらの企業に身分証明書を提出することが求められるようになるのではないかと、とても不安に感じています。

OpenAIはすでにサイバーアクセスプログラムのようなものを持っていて、基本的にはこれらのモデルをサイバーセキュリティ研究に使用するために、会社名や会社の目的、身分証明書のようなものをOpenAIに提出しなければなりません。

あるいは、これらの企業がサイバー研究へのアクセスを一切許可しないかもしれません。もしかしたら、政府やAnthropicだけがこれらのモデルでサイバーセキュリティ研究を行えるのかもしれません。そうなるとは言っていませんが、Mythosが危険であるという前例を作ることで、他のモデルも同じようなことにつながる可能性があると言っているだけです。

参考「OpenAIのGPT-5.4-Cyberアクセスプログラム」：
https://openai.com/ja-JP/index/scaling-trusted-access-for-cyber-defense/

ハッキング能力の民主化とその重要性

これは、一般の人々がハッキングを行う能力の民主化についての話です。これは、HD Moore氏がMetasploit※の開発で答えようとしていたのと同じ話です。

基本的に、HD Moore氏はMetasploitがコンセプトだった頃に同じことをしていました。HD Moore氏がMetasploitを書いたのは、政府と攻撃者だけがエクスプロイトを行う能力を持っている場合、防御側は追いつくことができないからです。

※Metasploitは、サイバーセキュリティの専門家がシステムの脆弱性をテストするために使用するツールです。簡単に言うと、パソコンやネットワークのセキュリティをチェックするための「安全なハッキングツール」です。これを使うことで、悪意のある攻撃者がどのようにシステムに侵入するかをシミュレーションし、事前に防御策を講じることができます。技術的な知識がなくても、セキュリティの重要性を理解するための手助けとなるツールです。

脆弱性を制限することはできません。エクスプロイトを持っている人だけがそれに対して防御することができます。エクスプロイトがどのように機能し、どう使われるのかを知らなければ、防御することはできません。

しかし、Metasploitのようなフレームワークを公開することで、エクスプロイトを商品化するだけでなく、防御側がハッカーのように行動し、それに対して防御する方法を学ぶことができます。パソコンを使用する人であれば、プログラマーであれ、一般の利用者であれ、ハッカーがどのようにハッキングしているのかを知っておく必要があります。エクスプロイトがどのように発生するかを知る必要があります。

そして、それを行う唯一の方法は、それを実際に実行することです。Metasploitのようなツールを使用し、Ghidraを使用し、バイナリを解析することです。いつやるか？今でしょ！今はハッキングを学ぶのに最適な時期です。ドミノがさらに倒れ始める前に、ぜひ試してみることをお勧めします。

最後に

このコラムで恐怖や不確実性、疑念を煽ろうとしているわけではありません。むしろ、もしこのまま「Mythosは怖い」という流れが続くと、どのような政策方向に進む可能性があるのかという非常に真剣な懸念を強調しています。

Mythosだけではなく、他のモデルも同様に怖いものです。

当サイトの内容、テキスト、画像等の転載・転記・使用する場合は問い合わせよりご連絡下さい。

エンジニアによるコラムやIDグループからのお知らせなどを
メルマガでお届けしています。

AI規制ドミノの始まり

関連するソリューション

サイバー・セキュリティ・ソリューション部
テクニカルスペシャリスト
ボルカーステン

Anthropicの戦略とその影響

政府の介入とその影響

代替モデルとその可能性

未来への懸念

ハッキング能力の民主化とその重要性

最後に

関連するソリューション

関連するナレッジ・コラム

カテゴリー

人気記事ランキング

AI規制ドミノの始まり

関連するソリューション

サイバー・セキュリティ・ソリューション部 テクニカルスペシャリスト ボル カーステン

Anthropicの戦略とその影響

政府の介入とその影響

代替モデルとその可能性

未来への懸念

ハッキング能力の民主化とその重要性

最後に

関連するソリューション

関連するナレッジ・コラム

カテゴリー

人気記事ランキング

サイバー・セキュリティ・ソリューション部
テクニカルスペシャリスト
ボルカーステン