AIとビッグデータの関係に変化 「少ないデータで開発」進む

shutterstock.com

高性能な人工知能(AI)を開発するためには、膨大なデータが必要であるとされている。しかし昨今では、少ないデータで効率的にAIを学習させるための研究が相次いで発表されている。

マサチューセッツ工科大学(MIT)とIBMの研究チームは、5月に開催されたAIカンファレンス「International Conference on Learning Representations(ICLR)」で、「Neuro-Symbolic Concept Learner(NSCL)」という新しい人工知能を公開した。これは、これまで異なるアプローチであるとされてきた「エキスパートシステム」と「機械学習」の技法を組み合わせたものとなる。

NSCLはまず、一部のデータから学習を通じて対象の特徴を抽出。それらをエキスパートシステム技法と結合して問題解決を行うという。ふたつのツールの結合により、従来よりもはるかに少ないデータ量で、昨今世に出回っているAIと遜色がない高いパフォーマンスを発揮することができるというのが研究チームの説明だ。

「敵対的生成ネットワーク(GANs)」というAI技法を使って、学習用のデータを大量に「生み出す」というアプローチもある。ドイツ・リューベック大学の研究チームは最近、GANsで高解像度のCTおよびMRI写真を大量に生成することに成功したという。このような技術が確立していけば、患者からプライバシーに関わるようなデータをわざわざ大量に集めなくともよくなるだろう。結果、AIの普及がより進む可能性を拓いてくれるかもしれない。

なお、少数のデータから優秀な人工知能を生む技法には、「転移学習(Transfer Learning)」や、「Few-shot learning」などがあるとされているが、ICLRが開催されたのと同じ5月に、サムスン電子が「話す頭(Talking Heads)」という顔アニメーション生成AIも公開している。

学習を終えた同AIは、学習していない、初めてみる人間の数枚の顔写真を学習するだけで、その人間の見たことがない表情、もしくは他の角度の写真を思い通りに生成できるという。初期段階では大量のデータが必要ということだが、一度、学習を終えてしまえば、その後は少ないデータで新たな画像を生み出すことができるそうだ。

日本では、欠損、もしくは不足しているデータを復元する「少量学習データソリューション」を提供するAIベンチャー・ハカルスなどがある。

「大規模なデータが必須となると、海外の大手ITプラットフォームに勝つのは至難の業。まだ勝ち目があるとすればリアル世界のデータとなるが、こちらも大手以外が大量に収集するのは簡単ではないだろう。何か画期的な方法論の確立が望まれる」(日本の学界関係者)

「AI開発の競争力すなわちデータ量」というテーゼを覆していくことは、より多くの国、また中小企業や個人にAI開発の門戸を広げていくことにつながるだろう。今後の研究結果に注目していきたい。

連載:AI通信「こんなとこにも人工知能」
過去記事はこちら>>

文=河 鐘基

ForbesBrandVoice

人気記事