AIが生成する画像「開発者も見抜けない」レベルに

(c) Andrew Brock, Jeff Donahue, Karen Simonyan

人工知能の“生成力”が本格的に発展しようとしている。上に並べられた写真のうちひとつは、人工知能が生み出した偽物だ。みなさんは正解が分かるだろうか。正解は最上段の一番左の画像イメージ。おそらく、ほとんどすべての人が見抜けなかったのではないだろうか。

英ヘリオット・ワット大学の博士課程の学生であるAndrew Brock氏は、グーグル・ディープマインドの研究チームとともに、本物と区別がつかないほどの精巧さを持った、犬や蝶、自然物などの画像を生み出す人工知能を開発した。

これらの技術は「敵対的生成ネットワーク(GAN: Generative adversarial networks)」をベースにしたものだ。端的に説明するならば、「騙すAI」と「見抜くAI」を競争させ、より本物に近い対象(ここでは画像やイメージ)を生み出す技術である。人工知能関連のさまざまなイシュー中でも、昨今、特に注目が集まる分野である。今年6月、フェイスブックのAI開発者であるYann Lecun氏も、GANは非常に重要な技術と言及したことがある。

Brock氏ら研究チームは、開発したシステムに対して「BigGAN」という名前をつけている。研究者たちは、自らが開発した人工知能に「犬」など特定のキーワードともに、2千枚ほどの写真を与え学習させ、その後、新しい画像を生み出すようにした。

興味深いのは、新しく生み出されたイメージについて、開発者であるBrock氏ですらもはや見抜くことができなかったという点だ。BigGANは、犬以外にも、「ジャガー」や「熊」の写真を生成したが、Brock氏はそれらを「グーグル検索」で収集した素材だと錯覚したという。開発者ですら見破れない画像を生み出すAIというのは、なんだか頼もしくもあり、恐ろしくもある。

とはいえ、BigGANもまだまだ完璧ではない。足が14本あるクモのイメージ(クモは8本足)や、植物と猫が融合した新生物の画像イメージを生み出したりと、特定の動物以外の生物画像を完全に生成するまでにいたっていない。BigGANがあらゆる画像を完ぺきに生成するためには、いましばらく時間が必要ということになりそうだ。

GANは画像だけでなく、動画や音声の生成にも応用できると考えられる。いずれインスタグラムなどに掲載される「リア充写真」もしくは「パリピ動画」が、簡単に人工知能でつくれる時代がくるかもしれない。

冗談はさておき、写真や動画には、人物や現場に接した証拠、つまり「真実を映す」という点に価値があった。例えば、写真・ビデオジャーナリズムは、その真実という価値によって支えられてきた最たるものだろう。

しかし、GANなど関連技術が発達すれば、写真や動画に真実を求めることは不可能になる。何を持って真実とするか。人工知能時代には、存在を証明する新しい技術やテクノロジーが必要となってくるはずである。

連載 : AI通信「こんなとこにも人工知能」
過去記事はこちら>>

文=河 鐘基

タグ:

ForbesBrandVoice

人気記事