AIが猛烈な勢いで進歩する中、革新企業として知られるサム・アルトマン率いるOpenAIから、興味深いニュースが届いた。OpenAIはどうやら、架空のGPTチャットのスクリーンショットを画像として生成する方法を編み出したようだ。
自分自身の画面の中で
ChatGPT Images 2.0によって、このモデル開発企業は、単なる「きれいな画像を作る力」にとどまらず、推論能力をも示す強力な画像生成を披露している。ほんの数年前まで、画像生成AIが出力するテキストはほぼ例外なく意味不明だったことを思い出してほしい。今やこの画像生成モデルは、はるかに大きなコンテキストウィンドウ(AIが1度に処理できる情報量の枠)を備えたことで、現実に即した世界を描けるようになった。同僚のアレックス・ウィスナー=グロスはX上で次のように述べている。
「OpenAIはChatGPT Images 2.0をリリースしました。思考能力を備えた同社初の画像モデルであり、ウェブ検索、1つのプロンプトからの複数画像生成、そして自らの出力の検証が可能です。GPT-Image-2はImage Arena(イメージアリーナ)の全リーダーボードを席巻し、テキストから画像への変換部門で歴代最高となる+242ポイントのリードを記録しました。そして目がくらむほどの再帰性を見せつけるかのように、OpenAIはこのモデルがChatGPTの会話画面をフォトリアリスティックなスクリーンショットとして生成するデモを披露しました」。
これは実に印象的だが、OpenAIで進行中の再帰的AIはこれだけではない。同社のシステムはますます自己参照的になりつつある。社内で進む業務そのものに貢献しているが、その業務とは、従来のモデルを圧倒する新モデルの開発に他ならない。
AIがAIを作る
OpenAIなどが一部出資するスタートアップが、まさにこの種の現実に取り組んでいることが明らかになった。AIがほとんど人間の監視を受けずに自らの後継を設計するという、極めて奇妙な自己再生とも言うべき営みである。ヒューマノイドロボットが仲間のために腕や手を組み立てている映像を思い浮かべてほしい。
Recursive Superintelligence(リカーシブ・スーパーインテリジェンス)は生まれたばかりの企業だ。その社内文書にはその起源が次のように記されている。
「共同創業者のリチャード・ソーチャーはSalesforce(セールスフォース)で培った深い自然言語処理の経験を持ち、もう一人の共同創業者であるティム・ロックテシェルはUniversity College London(ユニバーシティ・カレッジ・ロンドン)の教授であり、元Google DeepMind(グーグル・ディープマインド)のシニアリサーチャーとしてGenie(ジーニー)ワールドモデルプロジェクトの経験を有しています。チームにはさらに、OpenAIの元研究者であるジョシュ・トビン、ジェフ・クルーン、ティム・シーのほか、メタやグーグル出身の人材も名を連ねています」。
錚々たる顔ぶれである。では、この企業の目的は何か。
「Recursive Superintelligenceはまだ正式にはローンチしていませんが、人間の関与なしに自己改善を続けるAIシステムの構築を目指しています」と、The Decoderのマティアス・バスティアンは書いている。実に壮大な目標だ。
だが、話はそれだけにとどまらない。自律的であれそうでなかれ、多くの関係者がAIプラットフォームの進化に取り組んでいるこの熱狂的な状況下で、OpenAIの新モデルが間もなくリリースされるという噂もある。しかも、根拠のない話ではない。



