例えばユーザーが「こんな感じの雰囲気で、ここにこれを置いてほしい」と曖昧に伝えても、AIがその意図を補完し、不足している情報を自ら検索して計画を立てる。これがOpenAIの描く理想的なクリエイティブパートナーの在り方だ。
新しいChatGPTは、ビジネスシーンで十分に活用できそうなインフォグラフィックや、学術的な図解を巧みに生成する。多くの文字情報が詰まったドキュメントを1枚画のプレゼンテーションに仕上げたり、複雑な概念を図解化する作業に、AIは卓越した能力を発揮する。
ユーザーがイメージの断片を投げかけ、ChatGPTがそれを形にし、両者が「対話」を繰り返しながらさらにブラッシュアップする。こうした共同制作の過程において、AIはより能動的なスタンスで関わりを強めていくことになるだろう。
一方で、ChatGPTを本気でクリエイティブワークに活用するためには、ユーザーインターフェースにおいてまだ越えるべき壁がある。
現状、生成された画像をさらに微調整する際、再びテキストによるプロンプトを入力する以外に方法がないからだ。プロフェッショナルなデザインの現場では、レイアウトを固めた後にフォントを選んだり、ミリ単位で文字を詰めたり、細かな作業が絶え間なく続く。これをテキストプロンプトだけで行うことは難しい。Adobe IllustratorやCanvaなど外部のクリエイター向けアプリケーションで扱える、レイヤー化されたファイル形式で書き出したりといった、最終的な詰めをどこかで行うための機能が求められる。
創造性を支えるのは、見えない安全性
利便性が高まれば高まるほど、安全性への配慮も避けては通れない。画像生成AIが日常に溶け込むためには、その技術が信頼に足るものであることが大前提となる。
ハタ氏は、OpenAIは開発の初期段階から多層的なセーフガードを導入していると語る。デジタルウォーターマークの技術である「C2PA」などを採用し、AI生成画像であることを識別しやすくするだけでなく、メタデータを通じてその出自を明らかにしている。加えて、内部・外部のユーザーから上がってくるレポートを参照しながら生成内容をプロアクティブに監視し、ポリシーに違反する可能性のあるコンテンツを特定したうえで、必要な対応も行っている。
このように安全性を高めながらも、過度に制限しすぎない体験をデザインすることにも腐心していると、ハタ氏は語る。安全性への地道な取り組みは、最先端の技術を社会に定着させるうえで欠かせない。誰もが安心して自分のクリエーションを形にできる環境を整えること。そのための倫理的基準と安全設計こそが、次世代の画像生成AIを支える土台になる。
ChatGPT Images 2.0はその技術的な卓越性を探求しながら、同時に安全へのコミットメントを両立させることで、次世代のクリエイティブパートナーへの道を切り拓こうとしている。
連載:デジタル・トレンド・ハンズオン
過去記事はこちら>>


