音声会話を文字化。150以上の言語にリアルタイム翻訳もできる
UDトークは人と人によるコミュニケーションの「Universal Design=UD」を支援するアプリとして2013年に誕生した。現在はスマホやタブレットなどのモバイルプラットフォームを中心に利用者が拡がり続けている。
UDトークはディープラーニングの技術を活用するクラウド型音声認識サーバーを介して、人の音声を文字に起こして“見える化”できるアプリだ。活用シーンは1対1の会話から多人数のミーティングまで幅広い。筆者も去年、大規模なホールで開催されたディベート形式の技術セミナーや、グループ単位の講習会、新製品発表会等に足を運んだ際にUDトークが使われている様子を何度も目にした。
また、音声だけでなく、キーボードや手書きによる文字入力にも対応する。言語は日本語に限らず150以上の多言語翻訳もサポートしているため、国境や時差、文化の壁をも越えたボーダーレスなコミュニケーションを後押ししてくれる。
UDトークの音声認識や多言語翻訳はネットワーク上のサーバーを介して行うため、アプリを利用する際にはスマホやタブレットをオンラインにする必要がある。アプリの料金プランには個人単位から使える無料版と、主に法人向けの有料版があり、個人情報や機密情報などプライバシーに関わる音声コミュニケーションの扱い方に主な違いがある。
会話の内容はテキストによりアプリの画面に表示されるほか、合成音声による発話も聞けるため、視覚や聴覚などに障がいを持つ方々のコミュニケーションを支援するツールとしてもUDトークは広く利用されている。
日本語のテキスト表示は漢字変換も正確だ。漢字に「読み仮名」までふったり、初等教育の学習レベルに応じた「ひらがな変換」にも対応するため、就学児童のリモート学習や日本語を学ぶ方々のための学習支援ツールとしても注目されている。そのアプリのインターフェースは既にウェアラブルやARデバイスでの表示にも対応できているというから驚きだ。
会話のログはテキスト/HTML/CSVの3つの形式でモバイル端末に保存するか、またはメール等のアプリから共有もできる。
音声のほか、スマートフォンのキーボードや手書き文字入力にも対応。日本語を認識すると漢字変換と読み仮名が同時に表示され、漢字変換のレベルもアプリから詳細を設定できる。
また、会話のログ(文字起こしデータ)はテキスト/HTML/CSV形式のファイルで会議の参加者に共有することも可能だ。