【重要なお知らせ：当社を装った偽サイトにご注意ください】

2024.08.16 16:45

3秒聞くだけで瞬時に声マネ、日本語音声生成テクノロジー

Forbes JAPAN Web-News | Forbes JAPAN編集部

著者フォロー

記事を保存

Getty image

Getty image

誰かが話した音声データを、別の人の声や口調そのままに話す最新の日本語音声生成モデルが開発された。3秒ほどの音声データを与えれば、ものの0.5秒でその人そっくりに約30秒間の文章を話すというものだ。ほぼリアルタイムの音声生成が可能となり、幅広い用途に活躍しそうだ。

AI人材育成や研究開発を行うNABLAS（ナブラス）は、高度な日本語音声生成モデルを開発した。これは、Googleの音声生成モデル「SoundStorm」の構造をベースにしたもの。SoundStormはリアルタイムの対話も可能な音声生成モデルだが、残念ながら日本語に対応していない。そこでNABLASは、独自の日本語データセットを使って学習を行い、日本語対応モデルを作り上げた。

上の動画はSoundStormのデモの様子。「SoundStormに関するGoogleの論文について聞いてます？」「いや、うっかりしてた、どんなの？」「効率的な音声生成の並列コーダーで、会話に使えます」「へえ、面白いね」「そうなんです。これもSoundStormです」「え、ウソ！」といった内容。

日本語モデルはまだリアルタイムの対話はできないが、話者Aの話を3秒ほどサンプリングすれば、約0.5秒で話者Bが話した内容を話者Aの声、抑揚、話した方のクセなどを模した音声を生成する「Speech to Speech」が可能だ。

日本語音声コーパス（データベース）から所得した音声から雑音を排除するなど独自技術で処理した日本語音声データセットだけを用いて学習させているため、音声の品質が高い。また、日本語の音声生成に適したオーディオコーデックを用いているため、音声の類似度スコアは本家SoundStormよりもわずかに高いという。

この技術を使えば、たとえばエンターテインメント分野では、ひとりの声で動画コンテンツの複数のキャラクターにセリフを言わせるといったことも可能になる。発話が困難な人が自分の声で楽に会話ができるようにもなるだろう。カスタマーサポートで感情的になった相手に対して、オペレーターの感情の変化を悟られないよう冷静な口調で対応するといったことも可能になるだろう。同社はこの技術開発をさらに進めると同時に、悪用防止や悪用検出技術の開発にも取り組んでいくとのことだ。

プレスリリース

文＝金井哲夫

2025年6月号発売中

最新号の購入はこちらから定期購読のお申し込み

2025年6月号発売中

最新号の購入はこちらから定期購読のお申し込み

タグ：

FOLLOW US

Forbes JAPANの最新のニュースをお届けします

無料のメールマガジンに登録

進化を遂げたニューバランスの快適服「MET24」を、歌舞伎役者・中村歌之助が着こなす

不確実性の高い時代だからこそ、成果を出し続けられる「人間力」の育成を

NTTデータが見据えるテクノロジーが調和した金融の未来とは

第1回「ピーステック・アワード」開催へ！テクノロジーで平和な未来を創るスタートアップを発掘・支援

ゆるいつながりから変化への勇気が生まれる──。ワークスタイリングがつくる｢共感｣の力

省人化だけでは解決できないサービス業の“壁”を越える──「サービステック」と伴走支援で課題解決の先へ

視聴申込開始｜研究室からユニコーンへイベント第2弾は金融業界経験者に注目

多拠点サービス業の新スタンダード──。人の価値を創出する「サービステック」とは

AI、公共DX、サイバーセキュリティ…最先端な仕事を推進するEYストラテジー・アンド・コンサルティングのテクノロジー部門

「Japan Inclusive Ventures Lab-Tokyo Day-」開催。金融のチカラでスタートアップのグローバル展開を次のステージへ

World Happiness Report 2025が解き明かす「食」と幸福の科学的関係

多様性こそが競争力の源泉　三井物産女性活躍推進の軌跡

自らのミッションで組織と共に成長する──多様な働き方が生むイノベーション

日本発！大企業とスタートアップの協業が世界を変える

【20名限定でご招待！】横浜でアシックスウォーキングの「GEL-BIZ シリーズ」を体験できるOCEANS×Forbes JAPAN コラボイベント

医療、アパレル、子どもたち——。DELL STARTUP CHALLENGE入賞者が語る起業の原動力

進化を遂げたニューバランスの快適服「MET24」を、歌舞伎役者・中村歌之助が着こなす

不確実性の高い時代だからこそ、成果を出し続けられる「人間力」の育成を

NTTデータが見据えるテクノロジーが調和した金融の未来とは

第1回「ピーステック・アワード」開催へ！テクノロジーで平和な未来を創るスタートアップを発掘・支援

ゆるいつながりから変化への勇気が生まれる──。ワークスタイリングがつくる｢共感｣の力

省人化だけでは解決できないサービス業の“壁”を越える──「サービステック」と伴走支援で課題解決の先へ

視聴申込開始｜研究室からユニコーンへイベント第2弾は金融業界経験者に注目

多拠点サービス業の新スタンダード──。人の価値を創出する「サービステック」とは

AI、公共DX、サイバーセキュリティ…最先端な仕事を推進するEYストラテジー・アンド・コンサルティングのテクノロジー部門

「Japan Inclusive Ventures Lab-Tokyo Day-」開催。金融のチカラでスタートアップのグローバル展開を次のステージへ

World Happiness Report 2025が解き明かす「食」と幸福の科学的関係

多様性こそが競争力の源泉　三井物産女性活躍推進の軌跡

自らのミッションで組織と共に成長する──多様な働き方が生むイノベーション

日本発！大企業とスタートアップの協業が世界を変える

【20名限定でご招待！】横浜でアシックスウォーキングの「GEL-BIZ シリーズ」を体験できるOCEANS×Forbes JAPAN コラボイベント

医療、アパレル、子どもたち——。DELL STARTUP CHALLENGE入賞者が語る起業の原動力

進化を遂げたニューバランスの快適服「MET24」を、歌舞伎役者・中村歌之助が着こなす

不確実性の高い時代だからこそ、成果を出し続けられる「人間力」の育成を

NTTデータが見据えるテクノロジーが調和した金融の未来とは

第1回「ピーステック・アワード」開催へ！テクノロジーで平和な未来を創るスタートアップを発掘・支援

人気記事

もっと見る