グーグルCEOのスンダー・ピチャイが先に開催されたGoolge I/O 2024で発表した新機能「Ask Photos」は、Googleフォトの検索機能を、ユーザーのライブラリーからあらゆる情報を抽出して処理し、テキストによるプロンプトに応じてクリエイティブなタスクを実行できる本格的なチャットボットにアップグレードするという。
Googleフォトは以前から、写真の内容を対象にした検索や高度なサジェスチョン、消しゴムマジックといったAIを利用した編集ツールなどを搭載してきた。しかしAsk Photosがこれまでと違うのは、単なる写真ライブラリを、個人が生涯にわたって写真や動画を撮影する価値があると考えたものすべてが含まれるビジュアルデータベースに変えることだ。
今回のアップグレードの鍵となるのは、Geminiによって、ユーザーが増え続ける写真や動画のライブラリを、注意深く選ばれた検索ワードではなく、日常的な言葉で検索できるようになった点だ。ユーザーは、撮影したすべての写真や動画の内容を覚えているだけでなく、Googleフォトがそれらを理解している人間であるかのように会話可能になる。
グーグルはいくつかクエリのサンプルを提供している。「行ったことのある国立公園の最高の写真を見せて」「私の車のナンバープレートは?」「ルシアはどのくらい水泳がうまくなった?」などだ。Ask Photosは、状況に応じてテキストまたは画像ベースで応答することができる。
Ask Photosは生成AIを使って動画のハイライトリールのような新しいコンテンツの作成や、SNSに投稿するための適切なキャプションを提案することもできるという。