サービス名は「xpression camera Voice2Face」。AIが音声から声の主の表情を推定し、その外見を生成するという技術で、オンライン会議などで仮想の自分の姿を映し出すことができるという。
では、同社がこのような技術を開発する目的は何か。EmbodyMe代表の吉田一星(よしだいっせい)は、このサービスで現代病ともいえる「オンライン会議疲れ」の解消を目指しているという。どのように課題を解決するのか、吉田に訊いた。
ボサボサ頭もスーツ姿の整った髪型に
EmbodyMeでは、これまでも、カメラを介してAIが表情や体の動きを読みとり、その主の外見を自由に置き換えることができる「xpression camera」というサービスを提供してきた。
このサービスでは、パソコンの画面の前に座っていれば、ボサボサ頭の状態でもスーツ姿で整った髪型に自動変換できたり、有名人の顔になりすましてYoutubeのライブ配信を行ったりするということも可能だ。
現時点ではWindowsとMacに対応しており、カメラの起動をともなうサービスで利用できる。
オンラインのイベントで活用されるなど、エンターテインメント的要素での需要も多いが、開発の目的は、「オンライン会議疲れの解消」にあったという。吉田が語る。
「なぜ疲れてしまうのか。研究結果はすでに多く出ていますが、その1つはセルフビューです。オンラインの会議では、相手の顔とともに自分の顔も表示されます。言ってみれば、鏡に自分をちらちら映しながら、相手の顔も見て会話をしているようなものです。これだと自意識が過剰になりやすく、疲れの原因になってしまいます」
xpression cameraでは、仮想の姿で会議に参加できるため、こうした課題を解決することができる。ただ「疲れのもう1つの原因は、パソコンの画面に視線を合わせるため、無意識に体の動きが固定されてしまう。いままでのプロダクトでは、疲れの解消は半分しかできていなかった」と吉田は解説する。
サービスの利用者の95%が海外
そのもう1つの課題をクリアするために考えられたのが、前出のようなAIが音声から声の主の表情を推定し、外見を生成するという新サービス「xpression camera Voice2Face」だという。吉田が続ける。
「どんな姿勢であっても、家事をしながらでも、寝ころびながらでも会議に参加できるようになります。これで、オンライン会議疲れを完全に解消できるようになるのではないかと考えています」
EmbodyMeは、xpression camera Voice2Faceでは有料プランも同時にリリースし、会社として売り上げの成長にも注力をしていくという。
このようなAIでコンテンツを生み出す「Generative AI」が、将来的には数百兆円の市場規模になると、米国を代表するベンチャーキャピタルのセコイアは予想している。
すでに提供するサービスの利用者の95%が海外だというEmbodyMeだが、いずれグローバルで知名度の高い企業に発展していくのかもしれない。