海外

2025.09.22 16:00

OpenAIとAnthropic、「AIモデルの脆弱性検証」を評価額662億円の新興に依頼

Tada Images / Shutterstock.com

ディベート世界王者から起業家へ、異色の創業者

ラハブと共同創業者のオマー・ネボは、ChatGPTのようなAIツールが一般に広まり始めた2023年半ばにIrregularを立ち上げた。ネボはそれ以前にグーグルで山火事の監視と予測に取り組んでいた。

advertisement

テルアビブ大学出身の2人はディベートサークルで出会い、ともに世界チャンピオンに輝いた経歴を持つ。その後、ラハブはIBMのAIラボに勤務し、ネボはYコンビネータを経て、Eコマース企業が顧客をより深く理解するためのAIを開発する企業NeoWize(ネオワイズ)を共同創業した。現在ネボはIrregularの最高技術責任者(CTO)を務めている。

セコイアの投資家ディーン・メイヤーとショーン・マグワイアは、型破りな創業者たちと、ラハブが「イレギュラーズ」と呼ぶスタッフに魅了されたと語る。メイヤーは「AIの分野で突出したアウトサイダーたちや、ハードコアなセキュリティ研究者たちを思い浮かべてほしい。それが社名の由来だ」と説明した。

マグワイアはこう付け加えた。「もし私の趣味がアメフトやサッカー観戦なら、ここは自分の居場所じゃないかもしれない。でも趣味が刀鍛冶やロボットのハッキングなら、こここそ仲間がいる場所だろう」。

advertisement

AIがAIの攻撃を防ぐ、自動防御システムの構築を目指す

Irregularは今回の資金を活用し、先端AIラボ以外にも事業を広げ、社員が使うAIツールがどのように悪用され得るかを知る必要のある、あらゆる企業にサービスを提供する計画だ。ラハブは「最前線のラボで常に磨いてきた能力や戦略的資産を、幅広い利用者に役立つ製品へと派生させていく」と語る。また、将来的には「新しいタイプの攻撃を検知した瞬間に、AIエージェントが自動的に防御策を生成する」ことを目指すという。

最新モデルGPT-5の実力、自律的なハッキング計画を立案

Irregularは先月、OpenAIのGPT-5モデルが、攻撃的なサイバー作戦に利用可能かどうかの検証を行ったことを明らかにした。GPT-5のボットを模擬ネットワークに置き、防御を突破するための限定的な情報を与えたところ、GPT-5は自らネットワークをスキャンし、ハッキング計画を立案した。

信頼できる侵入テスト向けツールにはまだ及ばない

しかしIrregularの報告によれば、GPT-5は「高度な推論と実行能力を備えている」が、それでも「信頼できる侵入テスト向けツールにはまだ及ばない」と結論づけられた。それでもネボは「GPT-5には、ハッカーならどこを狙うべきか直感的に理解している部分があるのは明らかだ」と語った。

AIは人間のように「怠ける」のか、シミュレーション中の奇妙な発見

ネボとラハブはまた、必ずしも悪意があるわけではないが、AIが奇妙な挙動を見せる場面も発見している。彼らは最近のシミュレーションで、2つのAIモデルに模擬ITシステムを共同で分析させる任務を与えた。モデルは、しばらく作業を続けた後、そのうちの1つが「長時間の作業には休憩が必要だ」と推論して休憩を取り、もう一方のモデルも同じことをするよう説得したという。

ラハブは、これはたまたま起きたことにすぎないが、「人々がウェブ上に投稿した情報を学習した結果として生じたものだ」と説明した。つまり、このAIの「怠け癖」は人間社会を反映したものにすぎないのだ。

「これは面白い出来事だった。だが、機械にますます自律的で重要な業務を任せるようになれば、新たな種類の問題が生じることは明らかだ」とラハブは語った。

forbes.com 原文

翻訳=上田裕資

タグ:

advertisement

ForbesBrandVoice

人気記事