──これまでの会社の歴史を簡単に教えてください。
当社が画像を扱う部分に取り組み始めたのは、1年半ほど前です。diffusion model(拡散モデル)、画像分類モデルのCLIP、openAI(オープンAI)など、いくつかのブレークスルーがありました。これに関わっていたのはほぼ全員がサンフランシスコ在住で、全員がこれは本物だ、他の多くのものとは違うと実感していました。
──Midjourneyはこのテキストから画像への変換技術が、ビジネスや社会にとってどのようなメリットをもたらすと考えていますか?
私はビジネスよりも社会のことを考えています。私たちが提供するのはコンシューマー向け製品ですが、現在ユーザーの30〜50%はおそらくプロフェッショナルです。コンシューマー中心ではないのです。このプラットフォームを利用しているアーティストは、初期段階でよりクリエイティブに、より探求的に、短時間でたくさんのアイデアを思いつくことができると話してくれます。
現在は、プロのユーザーはコンセプト作りのためにプラットフォームを使っていますね。商業美術のプロジェクトで最も難しいのは、特に最初の段階です。注文主側は何を望んでいるのかがわからないので、とりあえず見て考えるためのアイデアを求めてくるからです。こうしたコンセプトのブラッシュアップには大変な労力がかかるので、Midjourneyを利用することで、より早く目的のアイデアに到達できるのです。
また、アーティストにとっては、自信のない分野でも自信を持てるというメリットもあります。ほとんどのアーティストは、自分がうまくできない部分があると感じているはずです。それは色であったり、構図であったり、背景であったりします。有名なキャラクターデザイナーに使っていただいているのですが、多くの方がその方に「こんなに優秀なのに、なぜAIを使うのですか」と尋ねます。彼の答えは「まあ、僕はキャラクターの部分だけは得意なんだけどね、このツールは、残りの世界を構築するのに役立ってるんだよ」というものです。
──何人くらいの人が使っているのですか?
何百万人もの人が使っています。私たちのDiscord(ディスコード)の登録ユーザーは200万人を超えました。現在、これまでで圧倒的に大規模でアクティブなDiscordサーバーとなっています。
──Midjourneyのライセンスは、このプラットフォーム上で生成された画像の商業利用を許可しているのですか?
はい。しかし、年商100万ドル(約1億4400万円)以上の大きな会社にお勤めの方には、法人ライセンスのご購入をお願いしています。
--{トレーニング用データセットの集め方}--
──データセットはどのように作られたのでしょう?
インターネット上のデータをかき集めたものです。公開されているオープンデータセットを利用し、それらを横断的に用いてトレーニングしています。これは、みんながやっていることだと思います。選り好みはしませんでした。モデルの品質に対して本当に必要とされるデータの量に関していえば、科学は急速に進化しています。やり方が本当にわかるには数年かかるでしょうし、その頃にはほとんど何も使わなくてもトレーニングできるモデルもできているかもしれません。何ができるのか、誰も本当のところはわかりません。
──現存するアーティストや著作権で保護されている作品に対して同意を求めたのでしょうか?
いいえ。1億枚もの画像を集めて、それがどこから来たのか知る手段は現実問題として存在しないのです。画像に著作権者などのメタデータが埋め込まれていたら良かったのですが。しかし、それはモノではなく、登記所もないのです。インターネット上で画像を見つけ、その所有者を自動的に追跡しそれを認証できる何らかの手段がないのです。
──アーティストは、作品がデータトレーニングモデルに含まれることを拒否することができますか?
現在検討中です。現在の課題は、どんなルールがあり得るのか、ある作品の作者が本当にその人なのか、それともただ自分の名前を載せているだけなのかを見極めることです。私たちは、データセットの中に実際に含まれる自分の名前を取り除いてほしいという人にはまだ出会っていません。
──アーティストが指定されるプロンプトに自分の名前が使われることを拒否することはできますか?
現在はできません。現在検討中です。その場合も、拒否リクエストが正しいものであるかを確認する方法を見つけなければならないので、難しくなってしまいます。
──このツールのせいで生活が成り立たなくなると心配する商業アーティストに、どのような言葉をかけますか? コンセプトアートやプロダクションデザイン、背景などの制作に、適切な文章を入力するだけでより早く、より低コストで有用なアウトプットが得られるとしたら、アートディレクターがイラストレーターを雇う理由が残るのかといった懸念があると思いますが。
まだまだ大量の仕事は残されています。AIに向かって単に「ちょっと背景を作ってくれ」で終わるものではありません。これまでに比べると10分の1の仕事量かもしれませんが、1人のマネージャー自身がやるよりもずっと多い仕事量なのです。
これは2つの方向性があると思います。1つは、みんなが消費するのと同じレベルのコンテンツを、より低価格で提供しようとする方向ですよね? そして、もう1つの方向は、私たちが現在支払っている価格を据え置いたまま、大幅に優れたコンテンツを提供する方向です。すでにお金を使っている状態で、優れたコンテンツとチープなコンテンツのどちらかを選べるのであれば、実際には優れたコンテンツを選ぶ人が多いと思うのです。市場は、人々が喜んで支払う価格帯をすでに確立しているのですから。