テクノロジー

2018.01.10 17:00

グーグルの「Tacotron2」が人間の声を再現、精度は「ほぼ人間」

河鐘基（ハ・ジョンギ） | Official Columnist ロボットやIoTの専門メディア「ロボティア」代表

著者フォロー

記事を保存

著者フォロー

記事を保存

Jozsef Bagota / shutterstock

Jozsef Bagota / shutterstock

人工知能（AI）が、人間の声を完璧に再現する水準に至ろうとしている。昨年12月中旬、グーグルがオンライン論文共有サイト「アーカイブ（arXiv）」に公開した報告書によると、囲碁AI「アルファ碁」で知られるグーグル・ディープマインドが開発した文字－音声変換システム「Tacotron2」が、人間と区別できないほど自然な発声能力を確保したという。

Tacotron2は、ふたつのニューラルネットワークで構成されている。ひとつ目のニューラルネットワークは、文字をスペクトログラムに変換する。スペクトログラムとは、音波を時間の流れに沿って視覚的に表現したものを指す。そのスペクトログラムを、ディープマインドが制作した音声合成ソフト「ウェーブネット」に入れると、ウェーブネットはそのデータを分析し人間の声として読み出す。現在、Tacotron2の平均オピニオン評価（MOS=メディアの品質を数値で評価する手法のひとつ）は4.53点をマークしたと言われている。これは、録音された人間の声の点数4.58点にほぼ近い数値だ。

グーグルの研究者はまた、Tacotron2が発音しにくい言葉に関しても上手く処理し始めていると報告している。例えば、句読点に合わせて発音したり、大文字で書かれた英単語を強調して読むなどがそれにあたる。

ただし、同システムはまだひとりの女性の声だけを真似できる段階にあるというのが現状のようだ。男性もしくは他の女性の声を模倣するためには、より多く学習を積む必要がある。また、上述の同研究結果については、査読（研究者仲間や同分野の専門家による評価や検証）を完了してはいない状態であることも付け加えておきたい。

とはいえ、人間の声を機械が再現する日は刻一刻と迫っているかもしれない。人工知能を使った「TTS：（Text to Speech）」技術の利点は、すぐに実用化できるという点にある。昨年公開されたウェーブネットは現在、「グーグル・アシスタント」に採用されている。今回紹介された新バージョンが搭載されれば、ユーザーはより自然な音声サービスを受けることか可能になるだろう。今年、人工知能はどこまで人間の声を再現できるようになるのか。その動向に注目したい。

文＝河鐘基

2025年7月号発売中

最新号の購入はこちらから定期購読のお申し込み

2025年7月号発売中

最新号の購入はこちらから定期購読のお申し込み

タグ：

FOLLOW US

Forbes JAPANの最新のニュースをお届けします

無料のメールマガジンに登録

政府も注目するガバナンス改革──デロイトトーマツのファミリーオフィスサービスが導く次の経営

「最速1兆円企業」への挑戦——三井住友銀行との出資提携と事業統合発表で加速するアスエネ流M&A戦略の真髄

デジタルの力で顧客への提供価値を最大化する──アサインのデジタル戦略とは

日本の医療を変革する、日本ストライカーの新章。「イノベーションのヒント」を揃えた新オフィスの全貌

脱炭素ワンストップで世界へ——トランプ政権下の逆風を追い風にしたアスエネのグローバル展開とM&A戦略

傑出した人材を集め、全体で成長する。「企業群」という新たな連帯について語ろう

事業は好調。でも“自分の財産”は守れていますか？ミドル世代の経営者のための財産戦略

グローバルに広がる資産と家族の未来──デロイトがグローバルネットワークでサポート

不動産を、もっと自由に──東通グループが挑む「しなやかな資産」の創造

自治体×スタートアップ共創の鍵を握る「ビジョンの共有」

「内と外」「経営と現場」——企業の“あいだ”で躍動するコンサルティングファーム・グロービングの実像

全世界ベースでの適材適所の実現を　三井物産が目指すこれからの人材戦略

アルミホイールを世界へ届ける人間力。苦難を越えて見出した「輪をつくる経営」

東京ヴェルディが実践するセルフモチベートする組織のための環境整備

terminal.0 PICK UP PoC |「衣類圧縮」でストレスフリー。起業家の熱意が共創のうねりを生む

「直接会える」が最大の魅力ーー20代・30代・未経験が主役のイベント「大転職博」をレポート

政府も注目するガバナンス改革──デロイトトーマツのファミリーオフィスサービスが導く次の経営

「最速1兆円企業」への挑戦——三井住友銀行との出資提携と事業統合発表で加速するアスエネ流M&A戦略の真髄

デジタルの力で顧客への提供価値を最大化する──アサインのデジタル戦略とは

日本の医療を変革する、日本ストライカーの新章。「イノベーションのヒント」を揃えた新オフィスの全貌

脱炭素ワンストップで世界へ——トランプ政権下の逆風を追い風にしたアスエネのグローバル展開とM&A戦略

傑出した人材を集め、全体で成長する。「企業群」という新たな連帯について語ろう

事業は好調。でも“自分の財産”は守れていますか？ミドル世代の経営者のための財産戦略

グローバルに広がる資産と家族の未来──デロイトがグローバルネットワークでサポート

不動産を、もっと自由に──東通グループが挑む「しなやかな資産」の創造

自治体×スタートアップ共創の鍵を握る「ビジョンの共有」

「内と外」「経営と現場」——企業の“あいだ”で躍動するコンサルティングファーム・グロービングの実像

全世界ベースでの適材適所の実現を　三井物産が目指すこれからの人材戦略

アルミホイールを世界へ届ける人間力。苦難を越えて見出した「輪をつくる経営」

東京ヴェルディが実践するセルフモチベートする組織のための環境整備

terminal.0 PICK UP PoC |「衣類圧縮」でストレスフリー。起業家の熱意が共創のうねりを生む

「直接会える」が最大の魅力ーー20代・30代・未経験が主役のイベント「大転職博」をレポート

人気記事

もっと見る