今後10年の間に来るトレンドは「音声」
海外のイベントに行けば当たり前のように使われているOtter.aiが日本語のサポートも行うことで、さらに競争が激しくなることが予想されるが、松田は「海外のサービスを大手企業や自治体が使うにはまだまだハードルが高い」と語る。
「文字起こしサービスは情報格差が大きい商材です。営業管理ツールなどはラーニングコストが低いものが多いですが、この領域はただソフトウェアを使うだけでなく、マイクは何を使えばいいのか、また部屋の大きさでハウリングも異なるのでどうマイクを使うべきなのか、そのあたりの情報を知らない人が多い。そこを私たちは営業でサポートしに行っているので、果たして海外のサービスがそこまで出来るのか、という思いはあります。
品質の良い音声ファイルであれば現状、7〜8割の精度で文字起こしができます。精度が悪いと言われる理由は、話している人の声質と集音の環境とネットワークに起因しています。そことどう折り合いをつけるか。運用を簡単にするだけだと精度が下がってしまいますし、ピンマイクをつけると精度があがる。ここの運用も実は肝になっているんです」
今後、Smart書記は近々、マイクから音声を綺麗に拾う機能も実装していく予定だという。
「2000年代前半にWindowsのパソコンやブロードバンドが登場したことで、電話・FAX文化が一気にパソコン文化に変わっていった。そして2010年前半になったらiPhoneやiPadの普及と同時に4G通信が始まったことで、チャットやクラウドサービスがビジネスシーンで広がっていきました。
音声デバイスが増えており、5Gが登場することで今後10年の間に『音声』の時代がやってくる。いまは、つぎのビジネスシーンを変える大きな節目を迎えていると思っているんです。10代は当たり前のように音声認識技術を使っていて、その人たちがビジネスシーンに入ってくれば、それが当たり前になる。今はブレイクスルーが起こる1歩手前の状態。ブレイクスルーが始まってから参入しては遅いので、今は非常にチャンスのある状況だと思っています。まずは音声データを蓄積し、お客様にも音声データを使って次の展開をやっていくためのサポートもできればと思っています」