AIは巨大で強力だ。新しい技術に少しでも触れた人々は直感的にそれを理解しており、さらに多くの人々がこれらのモデルの動作を目にしたり、急速に進化する様子を垣間見たりしている。
しかし、AIの役割とは何だろうか?
それをさまざまなデジタルタスクに分解したり、AIがエッジコンピューティングの可能性によって中央集権的なデータセンターから解放され、ロボットの体に宿るとどうなるかを考えたりすることもできる(私はそうしている)。しかし、別の視点としては、シミュレーションプロジェクトにおけるAIの役割を考えることもできる。つまり、AIとシミュレーションがどのように連携するかを考えることだ。
AIスペクトラムポッドキャストで、シーメンスのAI/ML技術スペシャリストであるジャスティン・ホッジス氏は、シミュレーションにAIを使用する主な側面について説明している。その多くはユーザーエクスペリエンスの向上に焦点を当てており、そこには多くの要素があるが、基本的な考え方は、エンジニアがシミュレーション環境にAIをどのように適用するかに光を当てている。
基本的に言えば、シミュレーションは精密に作成された豊富で堅牢なデータセットを提供するが、それらはリソースを大量に消費する可能性がある。そこでAIが、これらのデータセットを迅速に評価し内部化することができるのだ。
私にとって、これは2010年代後半の「機械学習時代」に多くの人々に現れた概念、つまり敵対的生成ネットワーク(GAN)のアイデアを反映している。
GANには2つの部分がある:生成エンジンと識別エンジンだ。あるいは、ジェネレーターとディスクリミネーターと呼んでもいい。ジェネレーターは、プロジェクトが関わる形式で新しい画像やデータを生成する。ディスクリミネーターはこれらを「見て」、何らかの決定を下したり、何らかの処理を実装したりする。このアイデアは初期の機械学習の専門用語に適用されたが、AIとシミュレーションの交差点を考える上でも依然として有用だ。
人間のイノベーターたちがこのアプローチの豊かな可能性を医療、工場、公共管理に見出すのに時間はかからなかった。製造業の例を考えてみよう。そもそもなぜ工場に人間が必要なのか?それは主に生成機械の製品を監視するためだ:ロボット装置はボトルに正しく充填したか?箱は適切に密封されたか?
GANのディスクリミネーターがその役割を果たせるなら、私たちはすぐに無人工場を持つことができる:ロボットがモノを作り、私たちは皆家に帰ることができる。
とにかく、それがアイデアだ:GANにおいて、これら2つの部分が特定の目的のために協力的に機能するということだ。
デジタルツイン:一例
ここに過去10年間のトップバズワードの一つがある:デジタルツイン。
これは、あるプロジェクトが複雑な現実世界のシステムのデジタルレプリカを構築することを意味する。それは車両や機器、建物やエコシステム、あるいは人体かもしれない。
人体の例を取ると、生成機能はウェアラブル、インプラント、体に関する情報を取得してシミュレーション用にコンパイルできるあらゆるものによって実行される。そしてAIがディスクリミネーターとなり、そのデータを取り込んで結果を生成する。
デジタルツインなどは無数の命を救い、私たちの世界を変革し、多くの面で生活の質を向上させるだろう。だからこそ、この最終目的地に至る途中で私たちが経験している中継地点について書く価値があるのだ。
GANの代替手段
GANがAI/ML操作の唯一のフレームワークではないことを指摘しておく必要がある。
例えば、変分オートエンコーダー(VAE)と呼ばれるものがある。Hugging Faceのこのリソースで詳細な説明を得ることができる。本質的に、機械は既存のデータセットから新しいデータセットを生成する。これは拡散モデルの動作方法に似ている。
「VAEは構造化された潜在空間を学習できるため、滑らかなデータ生成と補間が可能になり、生成AIで広く使用されています」とCodecademyの著者グループは書いています。「VAEは、医療やコンピュータビジョン領域における画像合成、データ補完、異常検出などのタスクで効果的です。」
それでも、VAEアプローチはGANや、今日のシステムへのGAN概念の適用とは異なる。私たちはシミュレーション用のデータを収集する膨大な手段と、識別作業を行う高性能なモデルを持っている。
ユニークで独自のデータセット
では、現実世界のデータが十分にない場合、AIに新鮮な入力を継続的に提供するにはどうすればよいだろうか?
これはAIがシステムや業界を席巻する中で、さまざまな文脈でよく尋ねられる質問だ。その考え方は、オリジナルの人間の作業がなければ、AIは物事を作り続けることができないというものだ。
GANやシミュレーション/AIループは、その問題の解決に役立つかもしれない。実際、Bingでソースを探そうとしたとき、Copilotは次のような内容を自発的に送ってきた:
「GANはデータ問題の単独の解決策ではありませんが、さまざまな方法でそれに対処するのに役立つ強力なツールです。GANは実データを補強するための合成データを生成することができ、これは元のデータセットが限られているか多様性に欠ける場合に特に有用です。GANはまた、元のデータセットに非常に似た新しいデータを生成するためにも使用でき、これは機械学習モデルのトレーニングに役立ちます。ただし、GANは生成される合成データの品質を確保するために、慎重な調整と検証が必要です。」
私は単に検索で「GANはデータ問題の解決に役立つか?」と尋ねただけだった。
Copilotは私が「データ問題」で何を意味しているかを理解し、すぐに回答を用意していたようだ。しかし、その考え方は、ジェネレーターが人間の代わりにオリジナルのものを作ることができるということだ。
さて、問題は、GANやシミュレーションが私たちのためにオリジナルコンテンツをどれだけ効果的にコンパイルできるかということだ。それは新しく興味深いものを生み出し続けるのか、それともループに陥ってしまうのか?決定論的プログラマー(今や時代遅れの遺物だが)なら、技術システムが一般的に、新たな高みを目指すのではなく、再帰的に自分自身の中でループする可能性がどれほどあるかを教えてくれるかもしれない。おそらく私たちは彼らに一押しすることができる。次の10年間で、システムの性質と人間の本質について多くのことが明らかになるだろう。今後の展開に注目したい。



