テクノロジー

2025.05.21 15:00

Google I/O 2025開催、新たに月額3万6000円のAIサブスク「AI Ultra」を発表

Andrej Sokolow/picture alliance/Getty Images

Imagen 4:進化したAI画像生成

AI画像生成ツールは、ChatGPTのAI画像ジェネレーターのアップデートでも示されているように、最も幅広く普及しつつあるAIアプリケーションのひとつだ。Google I/O 2025でグーグルが発表したImagen 4(イマジェンフォー)は、これまでで最も高度なテキストから画像への変換モデルであり、水滴や動物の毛、布地など細やかなディテールを非常にリアルに描写できるとされる。

advertisement

さらに特筆すべきは、画像内に正確で判読可能な文字を生成する機能が大幅に向上した点で、従来のモデルで課題とされてきた部分を克服している。これにより、ポスターやグリーティングカード、スライドのように正確なタイポグラフィを要するビジュアルを作成する用途で特に有用となる。

Imagen 4(イマジェンフォー)は、画像内に正確で判読可能な文字を生成する機能が大幅に向上した(YouTubeのスクリーンショット)
Imagen 4(イマジェンフォー)は、画像内に正確で判読可能な文字を生成する機能が大幅に向上した(YouTubeのスクリーンショット)
動画生成モデルVeo 3と画像生成モデルImagen 4、Geminiを統合したAI映像制作ツールとして、Flowが登場。米国のGoogle AI ProおよびUltraプランユーザー向けに提供を開始した(YouTubeのスクリーンショット)
動画生成モデルVeo 3と画像生成モデルImagen 4、Geminiを統合したAI映像制作ツールとして、Flowが登場。米国のGoogle AI ProおよびUltraプランユーザー向けに提供を開始した(YouTubeのスクリーンショット)

Project Astra

Google I/O 2025でライブデモが行われた、試作段階のマルチモーダルエージェント「Project Astra」(プロジェクト・アストラ)は、基調講演の中でも最も未来感のある発表だったといえる。スマートフォンのカメラを雑然とした机に向けると、Astraがそこにある物を説明し、周囲の情報を引き出し、音声ベースで連続的な会話を行う。

試作段階のマルチモーダルエージェント「Project Astra」(プロジェクト・アストラ)。マートフォンのカメラを雑然とした机などに向けると、Astraがそこにある物を説明し、周囲の情報を引き出し、音声ベースで連続的な会話を行う(YouTubeのスクリーンショット)
試作段階のマルチモーダルエージェント「Project Astra」(プロジェクト・アストラ)。マートフォンのカメラを雑然とした机などに向けると、Astraがそこにある物を説明し、周囲の情報を引き出し、音声ベースで連続的な会話を行う(YouTubeのスクリーンショット)

このデモは、以前盛り上がっていたARアシスタントやコンピュータビジョンの話題を思い起こさせるが、Astraのリアルタイム理解力と文脈認識能力が大きく際立っている。単に物体を識別するだけでなく、それらを推論し、視覚情報と記憶、音声を組み合わせて、受動的なチャットボットというよりは恒常的なアシスタントのように機能する点が革新的だ。

advertisement

Astraはまだ一般公開には至らないものの、高度な視覚認識など一部機能は年内にGeminiを利用するアプリやAndroidに導入される予定である。

次ページ > AIモードが正式実装、Gemini 2.5の実力

翻訳=酒匂寛

タグ:

advertisement

ForbesBrandVoice

人気記事