30U30

2022.09.06 08:00

業界が揺れた! フア・カンルが手がける「人間レベル」の音声合成

フア・カンル(Dreamtonics代表取締役・R&Dエンジニア、AHS代表取締役兼CTO)

革新的なプロダクトの登場で音声合成ソフトウェアの市場に激震が走った。その震源地にいるのは、国を跨またぎ日本で起業したひとりの若き中国人エンジニア、フア・カンル(25)だ。

フアは、日本発「世界を変える30歳未満」の30人を選出するプロジェクト「30 UNDER 30 JAPAN」で、テクノロジー&サイエンス部門での受賞を果たした。


2022年3月、中国・上海市出身のフア・カンルが率いるDreamtonicsと開発・販売パートナー企業のAHSは共同で、音声読み上げソフトウェアの市場を揺るがす新製品「VOICEPEAK」を世に送り出した。ここ数年、AI技術を取り入れたことで音声合成の品質は大きく向上。VOICEPEAKでは、本物の人間と聞き分けることが難しいレベルの音声を実現したのだ。

さらに、その技術を惜しむことなく、2万円台の圧倒的な低価格で販売。これまで商用利用が可能な音声読み上げソフトは数十万円の値がつくのが一般的だった。

「こんなに安くして儲けはあるの? とよく言われます。でも、音声読み上げソフトはまだ社会に広く認知されていない。みんなが気軽に使える価格で提供して、まずはこんなことができるんだと知ってもらうことが大事」とフアは話す。

「実際、従来のサブカルチャー領域だけでなく、学校のビデオ教材や、自治体や企業の社員研修動画、動画広告のナレーションなど、想定以上のいろんなシーンで使われているんです」

VOICEPEAKはすでに数万本以上を売り上げ、ヒット作となった。

“あえて”日本を選んだ理由


小学2年生でプログラミングを始め、中学生のときにボーカロイド「初音ミク」に衝撃を受け、音声合成のエンジニアを志した。高校生になるとオンライン講座「Coursera」を利用したり、論文を読みあさったりして、独学でプログラムを実装。大学では本格的な音声合成エンジンの開発に熱を注いだ。

気がつけば、「プログラミングは生活の一部。無意識のうちに手が動いている。コードを書かないと落ち着かない」というほどのめり込んでいた。

上海から日本に拠点を移して19年にDreamtonicsを立ち上げたのは、音声合成の市場が大きく、腰を据えて開発に取り組めると考えたからだ。当時、日本語は満足に話せなかったが、「世界中の言語で最も難しい日本語でいい製品をつくれたら、ほかのどんな言語でも同じことができる」と挑戦した。

こうして送り出された歌声合成ソフト「Synthesizer V」は、フアにとって最初のヒット作となった。現在は約60カ国で利用され、歌声合成市場では主要ソフトのひとつとなっている。

22年6月、フアはAHSの代表取締役兼CTOに就任した。「いちばんいい音声合成ソフトをつくりたい」という根底にある思いに変わりはない。

「自分自身の声を使ったり、感情を豊かに表現したりできる技術など、いろんなアイデアがあります。音声合成を使えば、人前で話すのが苦手な人でも、魅力的なプレゼンテーションができるようになる。この技術は多くの可能性を秘めているんです」

フアは、次にどんなプロダクトで私たちを驚かせてくれるだろうか。

「30 UNDER 30 JAPAN 2022」特設サイトはこちら>>
null

スウェット¥23100(モクティ/ユナイトナイン 03-5464-9976)、パンツ¥9900(アンフィーロ/オンワード樫山お客様相談室窓口 03-5476-8511)


フア・カンル◎1997年、中国・上海市生まれ。米イリノイ大学数学・コンピュータサイエンス学科中退。2019年、東京でDreamtonics設立。22年、AHS代表取締役兼CTO就任。

文=眞鍋 武 写真=帆足宗洋(AVGVST) スタイリング=堀口和貢

この記事は 「Forbes JAPAN No.089 2022年1月号(2021/11/25発売)」に掲載されています。 定期購読はこちら >>

ForbesBrandVoice

人気記事