近日中に、グーグルのAIモデルスイートであるGeminiで人物画像を生成する機能がGemini Advanced、Business、Enterpriseの顧客向けに復活すると、グーグルは米国時間8月28日のブログ投稿で発表した。他の画像生成ツール、たとえばMidjourneyやStable Diffusion、OpenAIのDall-Eと同様に、グーグルのImagen 3は、入力されたテキストや音声のプロンプトを、ほぼ瞬時に視覚的な表現に変換できる。
Geminiのプロダクトマネジメント担当シニアディレクターであるデイブ・シトロンはブログ記事で「プロダクトの技術的な改善、評価セットの改善、レッドチーム演習、明確な製品原則の策定に取り組んできた」と述べている。レッドチーム演習とは、悪意のある行動をシミュレートして製品の脆弱性を発見し修正することだ。
グーグルは、2月にGeminiを発表してから2週間後、特にライバルAI製品を開発中のテック起業家イーロン・マスクを含む批評家から「歴史的な民族や性別の現実と一致しない人物画像を生成している」として「ウォーク(woke:差別や不平等に敏感であるという意味だが、批判的な文脈で使われることが多い)」だと非難され、一部の画像生成機能を一時停止した。たとえば、物議を醸した画像には、黒人の男女が第二次世界大戦時代のドイツ軍の軍服を着ているものや、女性の教皇が描かれたものがあった。
これらの画像は瞬く間に拡散し、ソーシャルメディアでユーザーからの意見を積極的に受け入れていたグーグルAIプロダクトリードのジャック・クラフチクは、この問題で嫌がらせを受けた後、オンラインでの活動を控えるようになった。
グーグルとその親会社であるアルファベットのCEOであるスンダー・ピチャイは、従業員への社内メモで、画像の問題は「ユーザーを不快にさせ、偏見を示した」と述べた。彼はまた、「はっきりさせておきたいのは、これはまったく受け入れられないことであり、我々は間違っていた」と付け加えた。グーグルは論争への対応に追われ、株価は下落した。