米国のグーグルストアで249ドルで発売されたClipsは、即座に売り切れになり、現在は入荷待ちの状態だ。Clipsは5センチ角の正方形のカメラで、写真やモーションフォト(音無しの短い動画)を離れた場所から自動で撮影できる。
このデバイスが特徴的なのは、AI(人工知能)が “最高の瞬間”を判別し自動でカメラに収める点だ。人物の表情や光のあたり具合、フレーミングをマシンラーニングで学習している。
利用シーンとして想定されるのは、家族の集まりなどの場でカメラを設置しておき、思い出になりそうなシーンを自動で撮影させるというものだ。
グーグルのジョシュ・ラブジョイ(Josh Lovejoy)は、ClipsはAIベースのカメラではあるが、それを支えているのは人間だと説明している。彼はドキュメンタリー映画の製作者や報道写真家、アート系の写真家などにClipsで撮影した画像を評価してもらった。「思い出深い瞬間とは何か」を探るためだ。
その結果、AIにまず「悪い写真とは何か」を教えることが重要だと分かったという。そうすれば不要な写真を撮って時間を無駄にすることはない。
悪い写真とは、ポケットの中で不用意にシャッターが押されてしまったものや、レンズに指がかかっている写真などがあげられる。人間は撮り溜めた写真を整理するとき、まずそういった使えない写真を削除することから始めている。
ラブジョイはその後、ブレを抑えて撮影することや写真のフレームなどの基本を教え込んだ。顔がフレーム内に収まっているなど、構図に関する美的価値を理解させたのだ。
写真を撮るとき、人間の場合は被写体が誰であるかを認識し、表情やポーズから相手が撮られる準備ができたことを理解して撮影する。Clipsも持ち主の写真によく登場する人物を把握し、被写体としてフレームにうまく収めるよう教え込まれている。
写真を選ぶ際に重要なのは、ときに数千枚にも上る写真から最高の数枚を選ぶことだ。人間は直感で写真を選ぶが、AIがそれを行うためには現場の状況や時間の経過、色味や撮影対象が何人いるかといった情報を理解させる必要がある。
自動撮影カメラはこれまでも発売されてきたが、その質はまちまちだった。Clipsの性能がどれほどのものであるかは、試してみないと分からない。しかし、“良い写真”とは何かをAIに教えるプロセスを通じ、人間の側もより優れた写真を撮る方法を学べるのかもしれない。