2018.01.10 17:00

グーグルの「Tacotron2」が人間の声を再現、精度は「ほぼ人間」

河鐘基（ハ・ジョンギ） | Official Columnist ロボットやIoTの専門メディア「ロボティア」代表

著者フォロー

記事を保存

Jozsef Bagota / shutterstock

人工知能（AI）が、人間の声を完璧に再現する水準に至ろうとしている。昨年12月中旬、グーグルがオンライン論文共有サイト「アーカイブ（arXiv）」に公開した報告書によると、囲碁AI「アルファ碁」で知られるグーグル・ディープマインドが開発した文字－音声変換システム「Tacotron2」が、人間と区別できないほど自然な発声能力を確保したという。

Tacotron2は、ふたつのニューラルネットワークで構成されている。ひとつ目のニューラルネットワークは、文字をスペクトログラムに変換する。スペクトログラムとは、音波を時間の流れに沿って視覚的に表現したものを指す。そのスペクトログラムを、ディープマインドが制作した音声合成ソフト「ウェーブネット」に入れると、ウェーブネットはそのデータを分析し人間の声として読み出す。現在、Tacotron2の平均オピニオン評価（MOS=メディアの品質を数値で評価する手法のひとつ）は4.53点をマークしたと言われている。これは、録音された人間の声の点数4.58点にほぼ近い数値だ。

グーグルの研究者はまた、Tacotron2が発音しにくい言葉に関しても上手く処理し始めていると報告している。例えば、句読点に合わせて発音したり、大文字で書かれた英単語を強調して読むなどがそれにあたる。

ただし、同システムはまだひとりの女性の声だけを真似できる段階にあるというのが現状のようだ。男性もしくは他の女性の声を模倣するためには、より多く学習を積む必要がある。また、上述の同研究結果については、査読（研究者仲間や同分野の専門家による評価や検証）を完了してはいない状態であることも付け加えておきたい。

とはいえ、人間の声を機械が再現する日は刻一刻と迫っているかもしれない。人工知能を使った「TTS：（Text to Speech）」技術の利点は、すぐに実用化できるという点にある。昨年公開されたウェーブネットは現在、「グーグル・アシスタント」に採用されている。今回紹介された新バージョンが搭載されれば、ユーザーはより自然な音声サービスを受けることか可能になるだろう。今年、人工知能はどこまで人間の声を再現できるようになるのか。その動向に注目したい。

文＝河鐘基

2025年5月号発売中

最新号の購入はこちらから定期購読のお申し込み

2025年5月号発売中

最新号の購入はこちらから定期購読のお申し込み

タグ：

Forbes JAPANの最新のニュースをお届けします

続きを読むには、会員登録（無料）が必要です

無料会員に登録すると、すべての記事が読み放題。
著者フォローなど便利な機能、限定プレゼントのご案内も！

いますぐ登録する

会員の方はログイン

無料のメールマガジンに登録

無料登録

「巻き込み力」が組織を強くする　プロジェクトを成功に導く人材

海の最前列で時間を過ごす「UMITO」のぜいたくな日常

企業が“選ばれる側”になる人材流動化時代が到来、人事担当者が打つべき次の一手「社内版ビズリーチ」

100年企業「ベイリー・ギフォード」が貫く長期投資への揺るぎない信念

大学の研究シーズが世界の持続的発展を促す関西スタートアップアカデミア・コアリション（KSAC）の挑戦

和歌山県串本町を「宇宙のまち」へ変えたスペースワンとMUFGの進むチカラ

子どもたちが明日にも、未来にもワクワクしている社会を目指して——組織の壁を超えて挑む新しい協働のかたち

日本企業がAIを活用してグローバル競争に勝つために

愛知発、共創のムーブメント。地域とスタートアップが描く未来のスタートアップ・エコシステム

脳のもつ力を引き出す──LIFESCAPESのBMIリハビリ機器が脳卒中患者の新たな一歩をサポート

「誰もが空をかけるモビリティ新時代へ」本田宗一郎のイズムを継承したHondaJetシェアサービス

前編：ポストインターネットとなるか。企業間データ連携を促進する「データスペース」が描く未来

2025年のスタートアップ戦略──入山章栄が語る「踊り場」からの次なる一手

業種の垣根を越えた共創で描く「ドリームチェイサー」大分宇宙港への帰還の日

ニッコーとみずほ銀行がともに挑む食品加工産業の未来

多様性と経済成長の結節点に成田空港が目指す「エアポートシティ」の仲間探し

2025年はライブコマース元年になる　「買い物のエンタメ化」がもたらす未来とは

ふるさと納税は“モノ”ではなく“ヒト”のために──11年間続く『ふるさとチョイスAWARD』が示す未来

世界一のイノベーションハブになるために『新しい成田空港』構想が描く未来像

お客様とともに未来へ —誠実さと健全さを基点に付加価値を創造する山田＆パートナーズ

グローバルヘルスは「自分ごと」　野口健、阿川佐和子、堀潤と考える第一歩

キャッシュフロー改善と業務効率化で小規模事業者の成長を支えるJCBの「Biz ONE」

日欧の「事業ポートフォリオ変革」事例に学ぶ──データ活用で実現する新・事業共創

ブルネロ・クチネリ氏が語るファッションと思想の関係

「Japan Inclusive Ventures Lab-Tokyo Day-」開催。金融のチカラでスタートアップのグローバル展開を次のステージへ

M&A仲介の品質をさらなる高みへ　スピカコンサルティングが仕掛ける前代未聞の新プランとは？

ワイヤレス給電で未来のインフラを築く、エイターリンクの挑戦

NECのテクノロジーが命を救う GHIT Fundと考えるグローバルヘルスにおける技術活用のあり方

ゴリラ研究が解き明かす「食」の力──人類最古の文化が導く、現代のウェルビーイング

みずほ銀行が戦略パートナーとしてともに挑む、中堅・中小企業支援の新たなカタチ

REXEVが見据える、EVを活用した新たなエネルギーマネジメントの可能性

AI時代にテクノロジー人材が生み出せる「新たな価値」とは

「サッカーの力で笑顔の輪を広げたい」キリンとJFAが続ける価値共創活動

潜入！　成田空港が本気で挑む「情緒的価値のあるエアポート」会議

第一精工舎×みずほ銀行がともに挑む、プラスチックの新たな時代

就学前児童を対象とした小児用住血吸虫症治療薬開発から見えたグローバルヘルスの新たな協働モデル

「イケア効果」「利他性」「共有体験」──行動経済学的視点から解き明かす食と幸福度の関係

「松竹梅」から誕生した新ブランド「然土」が実現する “よろこびの清酒”とは？

先進テクノロジーがもたらす未来社会とは？NTT DATAが提示する5つの最新技術トレンド

後編：ポストインターネットとなるか。次世代企業間データ連携を促進する「データスペース」が描く未来

ビジネスシーンを快適にするGELテクノロジー搭載のレザーシューズ

コレクティブ・インパクトに取り組む組織としての意義——多様な主体による新しい価値創造とは

文系も理系もエンジニアを目指せる世界へスタッフサービス・エンジニアリングが描く「キャリア」の新たなかたち

日本の宇宙産業から新たなエコシステムを！MUFGが金融のチカラで育む未来への希望

「巻き込み力」が組織を強くする　プロジェクトを成功に導く人材

海の最前列で時間を過ごす「UMITO」のぜいたくな日常

企業が“選ばれる側”になる人材流動化時代が到来、人事担当者が打つべき次の一手「社内版ビズリーチ」

100年企業「ベイリー・ギフォード」が貫く長期投資への揺るぎない信念

大学の研究シーズが世界の持続的発展を促す関西スタートアップアカデミア・コアリション（KSAC）の挑戦

和歌山県串本町を「宇宙のまち」へ変えたスペースワンとMUFGの進むチカラ

子どもたちが明日にも、未来にもワクワクしている社会を目指して——組織の壁を超えて挑む新しい協働のかたち

日本企業がAIを活用してグローバル競争に勝つために

愛知発、共創のムーブメント。地域とスタートアップが描く未来のスタートアップ・エコシステム

脳のもつ力を引き出す──LIFESCAPESのBMIリハビリ機器が脳卒中患者の新たな一歩をサポート

「誰もが空をかけるモビリティ新時代へ」本田宗一郎のイズムを継承したHondaJetシェアサービス

前編：ポストインターネットとなるか。企業間データ連携を促進する「データスペース」が描く未来

2025年のスタートアップ戦略──入山章栄が語る「踊り場」からの次なる一手

業種の垣根を越えた共創で描く「ドリームチェイサー」大分宇宙港への帰還の日

ニッコーとみずほ銀行がともに挑む食品加工産業の未来

多様性と経済成長の結節点に成田空港が目指す「エアポートシティ」の仲間探し

2025年はライブコマース元年になる　「買い物のエンタメ化」がもたらす未来とは

ふるさと納税は“モノ”ではなく“ヒト”のために──11年間続く『ふるさとチョイスAWARD』が示す未来

世界一のイノベーションハブになるために『新しい成田空港』構想が描く未来像

お客様とともに未来へ —誠実さと健全さを基点に付加価値を創造する山田＆パートナーズ

グローバルヘルスは「自分ごと」　野口健、阿川佐和子、堀潤と考える第一歩

キャッシュフロー改善と業務効率化で小規模事業者の成長を支えるJCBの「Biz ONE」

日欧の「事業ポートフォリオ変革」事例に学ぶ──データ活用で実現する新・事業共創

ブルネロ・クチネリ氏が語るファッションと思想の関係

「Japan Inclusive Ventures Lab-Tokyo Day-」開催。金融のチカラでスタートアップのグローバル展開を次のステージへ

M&A仲介の品質をさらなる高みへ　スピカコンサルティングが仕掛ける前代未聞の新プランとは？

ワイヤレス給電で未来のインフラを築く、エイターリンクの挑戦

NECのテクノロジーが命を救う GHIT Fundと考えるグローバルヘルスにおける技術活用のあり方

ゴリラ研究が解き明かす「食」の力──人類最古の文化が導く、現代のウェルビーイング

みずほ銀行が戦略パートナーとしてともに挑む、中堅・中小企業支援の新たなカタチ

REXEVが見据える、EVを活用した新たなエネルギーマネジメントの可能性

AI時代にテクノロジー人材が生み出せる「新たな価値」とは

「サッカーの力で笑顔の輪を広げたい」キリンとJFAが続ける価値共創活動

潜入！　成田空港が本気で挑む「情緒的価値のあるエアポート」会議

第一精工舎×みずほ銀行がともに挑む、プラスチックの新たな時代

就学前児童を対象とした小児用住血吸虫症治療薬開発から見えたグローバルヘルスの新たな協働モデル

「イケア効果」「利他性」「共有体験」──行動経済学的視点から解き明かす食と幸福度の関係

「松竹梅」から誕生した新ブランド「然土」が実現する “よろこびの清酒”とは？

先進テクノロジーがもたらす未来社会とは？NTT DATAが提示する5つの最新技術トレンド

後編：ポストインターネットとなるか。次世代企業間データ連携を促進する「データスペース」が描く未来

ビジネスシーンを快適にするGELテクノロジー搭載のレザーシューズ

コレクティブ・インパクトに取り組む組織としての意義——多様な主体による新しい価値創造とは

文系も理系もエンジニアを目指せる世界へスタッフサービス・エンジニアリングが描く「キャリア」の新たなかたち

日本の宇宙産業から新たなエコシステムを！MUFGが金融のチカラで育む未来への希望

「巻き込み力」が組織を強くする　プロジェクトを成功に導く人材

海の最前列で時間を過ごす「UMITO」のぜいたくな日常

企業が“選ばれる側”になる人材流動化時代が到来、人事担当者が打つべき次の一手「社内版ビズリーチ」

100年企業「ベイリー・ギフォード」が貫く長期投資への揺るぎない信念

グーグルの「Tacotron2」が人間の声を再現、精度は「ほぼ人間」

関連記事