「AIがしゃべる仕組み」開発でユニコーン企業に。中国スタートアップの快進撃

shutterstock.com


ファン・メイユによれば、アカデミアと現実世界との距離を縮めるためには、研究室からマーケットまでの過程を完全に理解しなくてはならない。それは、非常に長い道程だ。そして、プロダクト思考に基づいた研究にはまた別の創造性がある。

「自分が開発しているコードの最適化を、ユーザーの視点から考える必要があります。そうやって自分が作ったものを実際に誰かが使ってくれると思うと、大きな達成感が得られるのです」

マイクロソフト在職中の2012年、ファン・メイユは中国に戻り、中国語版のコルタナ音声認識など、マイクロソフトの中国での音声認識と意味解析の研究を担った。ファン・メイユによれば、当時の計画では、中国語の音声対話システムを携帯電話に実装し、より多くの人にこの技術を使ってもらうことになっていた。

残念ながら、マイクロソフトが開発したWindows Phoneの市場が拡大することはなかった。その後、このシステムはWindows 10に組み込まれた。モバイルインターネットの時代、音声対話システムをパソコンで利用するユーザーの数は明らかに少ない。

ファン・メイユは、新技術は、大勢の人に利用されて初めてその価値が発揮されると考えている。彼女はモバイルインターネットの発達とともに、音声対話システムが多くのインターフェースに導入され、より多くの人の役に立つことを期待しているという。その期待は、彼女が研究成果の産業界への実装を目指して「Mobvoi」の創業に関わることを決めた大きな理由のひとつでもある。

プロダクト思考を持って研究することはグーグルの文化だ。2012年に設立した起業チームには、創業者兼最高経営責任者のリー・ジフェイや最高技術責任者のレイ・シンをはじめ、グーグルの元エンジニアが多く参加している。

音声対話、そしてソフトウェアとハードウェアのコンビネーションを中核に独自開発を始めたのは、デジタル信号処理、音声トリガーによる起動、音声認識、自然言語理解、音声対話制御、バーティカルサーチ、音声合成など、音声対話の複数の技術を組み合わせたものだった。Mobvoiは現在はユニコーン企業に成長し、人工知能を使った音声トラック技術の産業実装に取り組んでいる。


2012年に設立した起業チームには、創業者兼最高経営責任者リー・ジフェイや最高技術責任者のレイ・シンをはじめ、グーグルの元エンジニアが多く参加している。

会社は創業以来、次世代のヒューマン・コンピュータ・インタラクションを定義し、社会を人工知能消費の時代に誘導することを使命としている。これまでに開発した人工知能のソフトおよびハード製品には、スマートウォッチ、スマートヘッドフォン、スマートスピーカー、スマートバックミラーなどがあり、消費者向けに、身につけたり、車や自宅で使ったりする商品として販売している。

昨年からは、人工知能の技術と経験の蓄積が消費者レベルで進んだことを受け、音声認識人工知能ビジネスを企業向けに拡大し、人工知能技術を開発者や企業レベルの顧客に利用してもらおうとしている。

開拓中の法人顧客の業種はAIoT(人工知能とモノのインターネットを組み合わせた分野)、金融、生命保険、通信、自動車、健康保険と年金などで、人工知能の音声チップモジュール「Question」シリーズ、人工知能の不正対策ソリューション「Qingzhen」、人工知能の顧客サービス音声システム「inquiry」、車のダッシュボードに搭載するヒューマン・コンピュータ・インタラクション・ソリューションなどの製品を発売した。
次ページ > グーグルが中国市場に戻る?

翻訳=笹山裕子/トランネット 編集=石井節子

ForbesBrandVoice

人気記事