Imagen 4:進化したAI画像生成
AI画像生成ツールは、ChatGPTのAI画像ジェネレーターのアップデートでも示されているように、最も幅広く普及しつつあるAIアプリケーションのひとつだ。Google I/O 2025でグーグルが発表したImagen 4(イマジェンフォー)は、これまでで最も高度なテキストから画像への変換モデルであり、水滴や動物の毛、布地など細やかなディテールを非常にリアルに描写できるとされる。
さらに特筆すべきは、画像内に正確で判読可能な文字を生成する機能が大幅に向上した点で、従来のモデルで課題とされてきた部分を克服している。これにより、ポスターやグリーティングカード、スライドのように正確なタイポグラフィを要するビジュアルを作成する用途で特に有用となる。
Project Astra
Google I/O 2025でライブデモが行われた、試作段階のマルチモーダルエージェント「Project Astra」(プロジェクト・アストラ)は、基調講演の中でも最も未来感のある発表だったといえる。スマートフォンのカメラを雑然とした机に向けると、Astraがそこにある物を説明し、周囲の情報を引き出し、音声ベースで連続的な会話を行う。
このデモは、以前盛り上がっていたARアシスタントやコンピュータビジョンの話題を思い起こさせるが、Astraのリアルタイム理解力と文脈認識能力が大きく際立っている。単に物体を識別するだけでなく、それらを推論し、視覚情報と記憶、音声を組み合わせて、受動的なチャットボットというよりは恒常的なアシスタントのように機能する点が革新的だ。
Astraはまだ一般公開には至らないものの、高度な視覚認識など一部機能は年内にGeminiを利用するアプリやAndroidに導入される予定である。


