「AIがしゃべる仕組み」開発でユニコーン企業に。中国スタートアップの快進撃

shutterstock.com

マイクロソフトリサーチの主任研究員として鳴らした、ある中国の女性研究者がいる。その名はファン・メイユ。

マイクロソフト在職中の18年間に、機械翻訳の「Bing」、AIアシスタントの「コルタナ(マイクロソフトのパーソナルアシスタントで中国では「シャオナ」と呼ばれる)」などの研究開発に従事し、マイクロソフト中国の音声認識技術やSkypeの音声翻訳機能の音響モデル開発で活躍した辣腕科学者だ。

その彼女が、今度は産業界でポジションを確立し、参画したスタートアップをユニコーン企業にした━━。


彼女はカーネギー・メロン大学が開発したオープンソースの音声認識システム「CMUSphinx」の構築でも中心的な役割を果たした。彼女が1992年に提示した、「決定木アルゴリズム」(段階を追ってデータを「分割」、樹形図のような分析結果を得る分析手法)を基にした「マルコフ・ステート・クラスタリング」は、現時点における、音声認識システムの基盤ともいえる。

また、音声認識言語モデルの適応モデルと、中国語の意味理解の適応モデルを構築する、マイクロソフトリサーチのオックスフォードプロジェクトにも参加した。

音声言語技術の分野への多大な貢献が認められ、彼女は今年、IEEE(「アイ・トリプル・イー」International Electronic and Electrical Engineering Association)」のフェロー(最高レベルの会員)に選ばれた。

3年前、ファン・メイユは18年間働いたマイクロソフトを離れ、元グーグル社員が設立した中国の人工知能起業チームに加わって「Mobvoi」を設立し、エンジニアリング担当のバイスプレジデントとして「Mobvoi AI Lab」を立ち上げた。現在は音声認識と自然言語処理アルゴリズムの研究開発の責任者を務めている。

目を開かせてくれた師はリー・カイフー

「音声分野に興味を抱くようになったのは、最初の恩師であるリー・カイフーのおかげです」。ファン・メイユは「フォーブス・チャイナ」のインタビューに答えてこう語った。

ファン・メイユがリー・カイフーに関心を持ったのは、彼が研究中のプロジェクトについて説明を受けたときのことだった。


「師、リー・カイフーとの出会いが音声認識の分野にのめりこむきっかけでした」とファン・メイユ

「リー・カイフーが取り組んでいたのは、ビッグデータと統計の原理の、音声認識への応用でした。それには高度な数学的知識とプログラミングの技術が必要で、幸運なことにそのどちらもわたしの得意分野でした」

ファン・メイユは数学が好きで、プログラミングもコードを書き出すと止まらないほどだという。

「リー・カイフーは1時間ほどかけて、自分の研究システム全体の概要と理論を説明してくれました。それから米国の通信研究所、ベル研究所が出した古典的な論文をくれて、自分が書いているコードを見せてくれたんです」

ファン・メイユは、リー・カイフーが書いた何千行にもわたるコードを読んで、そこに「ひらめきを伴う思考」のようなものがあると感じた。「彼のコードとそれに対応する数学理論を比較して、わたしは数学をコードに変換する方法を知りました」。そのことがきっかけとなって、ファン・メイユは音声分野に興味を持った。

『ビジネスウィーク』誌の「最も重要な科学的イノベーション」に選出

それから30年以上たった現在も、ファン・メイユは、自分は幸運だったと感じている。リー・カイフーから説明を受けた後すぐ、カーネギー・メロン大学(CMU)の自分の博士論文のテーマを「音声認識」に決めた。リー・カイフーとのやりとりで知ったこの研究分野は、彼女にとって何よりも情熱を注ぎ、「満喫できる」世界だという。

1988年、リー・カイフーはコンピュータサイエンスの博士号をカーネギー・メロン大学から授与され、その後同大で2年間、教鞭をとった。助教授としての在職中、リー・カイフーが率先して開発したのは、統計の原理を使った世界初の「非特異的な語彙の連続音声認識システム」で、その研究は『ビジネスウィーク』誌の「最も重要な科学的イノベーション」に選ばれた。この受賞によってリーは、IT研究分野における指導的な立場を確立した。
次ページ > 新技術がもたらす3つの実現

翻訳=笹山裕子/トランネット 編集=石井節子

ForbesBrandVoice

人気記事