シュルマンなど4人が音楽生成AI Sunoを創業
音楽は昔から、シュルマンの人生に欠かせないものだった。ニューヨーク市のピーター・クーパー・ビレッジで育った彼は、4歳でピアノを始め、12歳でベースギターに転向した。大学時代にはバンドを結成し、市内のライブに出演していた。「ただ、私は楽器の演奏が上手くはない。ギターは弾けるふりをしているだけだし、ドラムも似たようなものだ」と彼は語る。
その後、シュルマンはコロンビア大学に進み、応用物理学の学位を取得した。2015年にはハーバード大学で物理学の博士号を取得し、データ分析企業Kenshoに機械学習エンジニアとして加わった。そこで彼は40人のデータサイエンティストからなるチームを率い、後に共同創業者となるジョージ・クチュコ、マーティン・カマチョ、キーナン・フライバーグと出会った。3人はいずれも音楽のバックグラウンドを持つ。2018年に金融情報企業S&PグローバルがKenshoを買収した後、4人は決算説明会の音声を書き起こすための音声モデルを訓練する仕事に取り組んだ。そして夜になると、カマチョの地下室に集まり、ジャムセッションをしていた。
4人はやがて、音声データは雑然としていて扱いにくいものの、音声認識モデルや音楽モデルを訓練する上で大きな価値を持つことに気づいた。彼らは2022年2月にS&Pグローバルを退社し、Sunoを創業した。2023年には、短い音声クリップやリアルな話し声、笑い声やため息といった非言語音を生成する、人気のオープンソースの音声合成モデル「Bark」を公開した。
ChatGPT公開後、Sunoが見出した技術的突破口
だが、AIに音楽を作らせるのは難しい。Sunoのチームは当初、音楽のように聞こえる音声を生成できるモデルを訓練するには、実際に必要だった量の100倍の計算能力と資金が必要になると考えていた。テキストは単語やフレーズという識別しやすい単位にきれいに分解できるが、音を構成する信号は高速かつ連続的であり、符号化するのがはるかに難しい。
しかし、2022年11月にChatGPTが公開されてから間もなく、Sunoは最初の技術的な突破口を見いだした。Sunoは、曲の構造やスタイルをモデルに学習させるのに役立つ音楽の要素を表現する方法を突き止めた。2022年末、4人はクチュコのケンブリッジの自宅のキッチンテーブルを囲み、モデルが初めて生成した、実際に曲のように聞こえるAIメロディーを興奮しながら聴いた。
「こちらが特に何かを教え込まなくても、モデルは短い音声の断片から始めて、徐々に長く、まとまりのある音を組み立てることを学んでいく。最終的には1曲まるごと作れるようになる」と、最高技術責任者(CTO)で共同創業者のクチュコは語る。
Sunoは2023年9月、まずDiscordのボットとしてサービスを公開した。クチュコによれば、初期版のモデルの出来はひどかった。それでも公開から1カ月以内に、ブラジルやポルトガルなど世界各地から1000人を超える有料会員がこのツールに集まった。共同創業者で社長のカマチョは、これによって大量のフィードバックが一気に寄せられるようになったと語る。その反応を受け、チームはユーザーが自分の録音音声をアップロードできる機能を追加した。
共同創業者は、伝統的な西洋音楽理論のルールを意図的にモデルへ教え込まなかった。モデルの理解を12音(クロマチック・スケール)に限定すれば、AIはまったく新しいサウンドを生み出せなくなるからだ。「驚くべきことに、モデルは楽器や声というものが存在することすら知らない。すべてを単なる音として扱っている」とシュルマンは語る。
Sunoの技術的優位性は、長くは続かない可能性
ただし、Sunoの技術的な優位性は長く続かないかもしれない。競合が勢いを増しているからだ。
競合のUdioは、2023年にGoogle DeepMindの元研究者が創業した。シード資金は1000万ドル(約15億7000万円)、月間ユーザー数は330万人。Udioは2024年、Sunoと並んでレコード会社から提訴されたが、その後UMGおよびワーナーと和解している。
2026年2月にはグーグルがSunoの競合であるProducerAIを買収し、自社の音楽生成モデル「Lyria 3」を訓練した。Lyria 3はGeminiに組み込まれており、ボーカル、歌詞、楽器演奏を含む楽曲全体を作曲できる。
シュルマンによれば、Sunoの本当の差別化要因はモデルそのものではなく、ユーザーが何度も戻ってきて音楽を作りたくなるプロダクトにあるという。
業界全体に目を向ければ、AIが粗製乱造した楽曲はすでにストリーミングプラットフォーム上で存在感を増し始めている。フランスの音楽アプリDeezerは4月、1日あたり7万5000曲のAI生成楽曲がアップロードされており、1日のアップロード総数の約44%を占めていると発表した。2025年秋にはSpotifyが、「スパム的」と判断した楽曲7500万曲をプラットフォームから削除したと明らかにした。Apple Musicは、コンテンツの重要な部分がAIで作られている音楽について、レコード会社や配信事業者に「透明性タグ」の付与を義務付け始めた。対象はアルバムアートワーク、楽曲、歌詞、ミュージックビデオなどだ。Spotifyも現在、楽曲のどの部分にAIが使われたのかを明示する同様の機能を導入しつつある。
ただし、AI音楽が実際に聴かれている割合は低く、Deezerによれば、AI音楽は総ストリーミング再生数の1〜3%を占めるにすぎない。大手レコード会社のある幹部は、AI音楽について「実態よりも話題としての存在感の方がまだ大きい」と語る。「ヒットも散発的にはあるが」と彼は続けた。AI音楽が将来的に商業的な成功を収めるかどうかはまだ未知数だ。
Deezerによれば、2025年にAI生成楽曲で発生したストリーミング再生の85%は不正と判断された。ある業界幹部はフォーブスに対し、「AI音楽は、ロイヤリティを横取りする仕組みの道具であり、不正再生を量産する温床とも言われている」と語る。
一部のアーティストはすでにその影響を受けている。『Last of the Cowboys』や『Life on 18 Wheels』といったカントリーヒットで知られるテネシー州ノックスビル拠点のインディペンデントアーティスト、トニー・ジャスティスがその1人だ。彼は、AI生成楽曲がストリーミングアプリに入り込むようになったことで収入が打撃を受けたと語る。失われた収入を補うため、スポンサー探しや別の収益源の開拓を迫られているという。
「奪われたような気持ちになる。乗っ取られ、自分が積み重ねてきた努力をすべてはぎ取られたように感じる」とジャスティスは語る。彼は2025年6月、数千人のアーティストとともにSunoを相手取り、著作権侵害を主張する集団訴訟を起こした。Sunoは一部の請求の却下を求めており、訴訟は現在も続いている。


