これまで何度か言及した囲碁のAIはこの点でもとてもAI向きでした。一手ごとの選択肢は最大で361を超えることはありませんし、ルールに基づく「石を打ってはいけないところ」を除けば別にどこに打っても構いません。
そして、その有限な選択肢の中から「最も強力な手」が見つかれば、それ以上に良い判断はこの世にありません。これが、私が「有効性が高い」という状況です。
では逆に、有効性が低い状況とは何でしょうか?それは囲碁とは逆に、あまりにも膨大な組み合わせがあり、その組み合わせの多くは無意味どころか有害で、仮に想定していた組み合わせの中からベストなものを選んだとしても、その組み合わせの外に「さらにもっと有効なものが存在しうる」という状況です。
例えば「広告動画を作る」というAIを仮に作ろうとした場合を考えてみましょう。
人間が広告動画を作るためにはコンセプトを考え、コピーを考え、出演するタレントをキャスティングし、ロケなりスタジオなりの背景を整え、脚本を書き、適切に照明を当て、適切な角度からカメラで撮影し、音楽や効果音を合成する、といった専門スキルが必要になってきます。
もちろんこれらのプロセスをAIに扱いやすいようCGの世界の中だけで行っても構いませんが、問題はこれらの組み合わせがあまりに膨大すぎることです。
例えばシナリオのト書きに書かれている「動き」をさせるだけでも、体中のありとあらゆる関節を上手くコントロールしなければぎこちなくなってしまいます。
また、囲碁では前に打った手によって次の手の意味が変わる、ということはあまりなく、一手ごとの状況下で「ベストなもの」を判断していれば大丈夫ですが、広告動画では1つ前のシーンのセリフによって後のシーンのセリフの意味が大きく異なって捉えられる、ということはいくらでもあります。
映像を専門的に勉強してきた人なら、ライティングやカメラワーク、スタジオ内の小道具を少し変えただけで大きく印象が変わることだってご存じでしょう。