米プリンストン大学の研究チームは、4000組の家族に関する、1万3000のデータポイントを持ったビッグデータを、コンピュータ科学者、統計学者、社会学者など数百人の専門家に提供。各家庭の子供の将来的な成績などを予測するアルゴリズムの開発を要請した。しかし、研究者らが提示した最先端の機械学習、もしくは統計分析方法などを取り入れたアルゴリズムによる予測結果は、すべて精度が落ち、いずれも研究基準に満たなかったという。
より詳しい研究プロセスは次のようになる。
まず研究チームは、2000年に米大都市の病院で生まれた子どもと家族を無作為に選んだ。そして、子たちが1歳、3歳、5歳、9歳、15歳の時の状況を追跡。継続してデータを集めた。そこには、子どもたちの学校成績の平均、失敗した時に挑戦する根気の度合い、学校から報告された忍耐力、家族の経済的水準など多くの項目が含まれていた。
研究チームはデータの中から15歳の時のものを除き、アルゴリズムを構築するのに必要な十分なデータを研究者に提供した。そして研究者たちは9歳までのデータをもとに、子供たちの未来を予測するアルゴリズムの開発を進めた。最終的に最新技術を取り入れたさまざまなアルゴリズムが結果をはじき出したのだが、研究チームが実際のデータと比較したところ、どれひとつとして一定水準の正確さ担保することができなかったという。
この研究には、少なくともふたつの教訓があるだろう。
ひとつは報告通り、現段階のAI技術では「人間の未来や社会現象を予測することはできない」というものだ。例えば、米国の刑事司法システムで使用されているリスク評価アルゴリズム(犯罪予測アルゴリズム)も、現段階における精度は60〜70%が最大値であるという話もある。日本でも近年、人事評価や個人の信用算出などにAI技術が導入の動きがあり注目されているが、おそらく未来を予測しきることまでは不可能だろう。これはネガティブであると同時に、人間に未来が拓かれているという意味でポジティブでもある。
もうひとつの教訓は、「まだまだデータが足りない」かもしれないということだ。人間はデータとして可視化された以上に、膨大な経験や刺激を情報として蓄え変化していく。そこには例えば、恩師の言葉や、忘れることができない失恋、予想外の出会いなどあらゆることが含まれる。むしろ“可視化されたくない情報”もあるだろう。社会全体で起きていることとなれば、もっともっと膨大だ。仮にそれらデータをすべて取ることが可能となれば、「未来を予測するAI」は実現可能となるのだろうか。この点は、専門家たちの意見を待ちたいところだ。
ひとつだけ確実なのは、未来を予測したいという人間の欲望や需要はなくなることはなく、不確実性が高まる世にあってはさらに増していくということだ。DX、IoT、デジタルツインなど昨今話題のキーワードが目指すところは、多少の差異はあれど、いずれも未来予測に収束する。未来を見通す技術はどのようにして生まれてくるのか。もしくは、最後まで誰にも未来は予測できないのだろうか。関連研究の続報が待たれる。
連載:AI通信「こんなとこにも人工知能」
過去記事はこちら>>