しかし、ある技術の進歩によって、その予想は間違っていたことが証明されつつあります。
それが「Generative AI」です。
Generative AIは、機械学習を使って、既存のデータセットから新しい画像や動画、テキストなどを生成することができる技術です。例えば、猫の写真のデータセットを学習させることで、今まで見たことのない新しい猫の画像を生成することができます。
Generative AIがもたらすインパクトは非常に大きく、私たちの創造性や社会を大きく変えていくでしょう。このコラムでは、Generative AI時代における私たちの創造性や、社会がどのように変化していくか、その中で私たち個人がどのように準備していくべきかを考えていきます。
すでにここまで進化しているGenerative AI
Generative AIの今を語る上で画像生成AI「Stable Diffusion」と、対話型チャットAI「Chat GPT」の2つを紹介しないわけにはいきません。
Stable Diffusionとは、テキスト入力されたワードからAIが自動で画像を生成する画像生成AIサービスです。生成できる画像はフォトリアルな画像からアーティスティックな絵画風のものまで幅広く、生成した画像の複製や改変、商用利用も可能になっています。それまでにも「DALL·E 2」や「Midjourney」などの画像生成AIはありましたが、「Stable Diffusion」はオープンソースとして公開されていることで、世界中のデベロッパーがそれを元にした派生モデルを開発・公開しており、非常に強力なツールとなっています。
Stable Diffusionで実際に生成された画像をいくつか紹介しましょう。
以下のように写真と見分けのつかないポートレート画像や、微細な風景画も生成することが可能です。
The model also has the power to render non-standard resolutions. That helps you do all kinds of awesome new things, like works with extreme aspect ratios that give you beautiful vistas and epic widescreen imagery. #StableDiffusion2 pic.twitter.com/QnjYOcWsQ9
— Stability AI (@StabilityAI) December 7, 2022
わたし自身も存在しない美術館の写真を生成して遊んでいます。
最近はAIで存在しない美術館の写真を生成することにハマってます。 pic.twitter.com/dYSlfMWkLB
— 梶谷健人 / Kent Kajitani (@kajikent) December 5, 2022
また、「Chat GPT」はOpenAIが開発した「GPT-3」という大規模な言語モデルを組み込んだチャットアプリケーションです。「ChatGPT」は人間が入力した自然言語を理解し、それに応じた回答をすることができます。また、質問の回答以外にも、コードの生成や、コードのデバッグ、はたまたジョークを作ったりすることが可能です。いままでも対話可能なAIボットはいくつか存在しましたが、Chat GPTは回答可能なカバー範囲や、回答の自然さが話題になっています。