今週まで、Midjourneyの出力はデフォルトの解像度1024x1024ピクセルに限定されていた。これは中規模のウェブ画像には十分だが、はがきサイズより大きくプリントするには足りない。
同社は、画像を2倍または4倍にアップスケーリングする機能を追加。これにより、デフォルトの正方形フォーマットでの最大サイズは、4K解像度を超える4096x4096に増大した。異なるアスペクト比を持つ画像にも適用でき、たとえば16:9の画像では、4倍のアップスケーリングによって5824x3264の画像が出力できる。
解像度の大幅な向上により、MidjourneyのAI生成画像は、A3サイズで印刷してもぼやけたり、荒くなったりしない。高品質なウェブ画像やデスクトップの壁紙を作成するのにも十分だ。
アップスケールの代償
アップスケーリング機能の利用には代償がある。デフォルトサイズへのアップスケーリング処理が通常数秒で完了するのに対し、4倍のアップスケーリングには2、3分かかることもある。Midjourneyは、処理時間の量に対して課金するため、アップスケーリングを利用すると、月間の許容量内で生成できる画像の数が減る。ただ、追加料金を支払えば、利用可能な時間を延ばすことができる。
また、同社はアップスケーリング処理が不安定な可能性があると警告。「非常にまれ」なケースとして、4倍の拡大により「黒い画像や破損した画像」が生成される場合があると述べている。また、もともと不明瞭な画像はアップスケーリングしても画質が改善されることはないとも説明。画像がアップスケーリング後にわずかに暗くなる可能性もあるともしている。
高解像度競争
アドビはこの1週間前に発表した画像生成AIの最新バージョン「Firefly 2(ファイアフライ2)」で、生成画像の解像度を2048x2048に引き上げていた。これはMidjourneyの2倍アップスケーラーと同じ解像度だが、4倍アップスケーラーの解像度の半分となる。このように、生成AIアート業界では競争が激化しており、各社は画質と高解像度を競い合っている。OpenAIが最近発表したDALL·E 3(ダリ3)は、テキストプロンプトに記述された画像を生成する能力の向上に加え、デフォルトの解像度を1729x1024に引き上げた。
(forbes.com 原文)