「音声の同時翻訳もいずれ可能になる」
機械翻訳ツールDeepLの開発者で、数学者でもある同社CEOヤロスワフ・クテロフスキーは、機械翻訳の先に「音声」を視野に入れていた。
世界10億人以上に利用され、29の言語に対応し、言語間のコミュニケーションの壁を難なく乗り越える機械翻訳ツール「DeepL」。2017年8月のローンチから5年で、訳文の出力スピードは数秒まで短縮し、ほぼ同時翻訳レベルに到達した。
先発組のGoogle、Microsoft、Facebookとしのぎを削る競争の結果だ。だが、支持される理由は、ニュアンスまで訳すという訳文のクオリティの高さにあり、プロの翻訳者のブラインドテストで他社を凌ぐ高評価を得ている。
日本に登場したのは 20年3月と歴史は浅いが、ドイツに次いで世界2番目の市場規模に拡大した。「グローバルのなかで日本でのポテンシャルは高い」とクテロフスキーは期待を込める。日本語特有の主語の脱落やスペースのない文章も難なく英語に変換し、他社のツールと比べ誤訳が少ない。これは同社が開発に注力するニューラルネットワークの強みにある。
「ニューラルネットワークというのは、まだ発達していない子どもの脳のようなものなのです。何でも吸収して学習していくのです」
良質で膨大な翻訳テキストさえ見せれば、たとえそれが方言でも、難解な分子生物学であっても学習しほぼ同時翻訳してしまう。つまり、日本語の特質も、機械学習の前では障害にならないということだ。この能力をクテロフスキーは「AIの美しさ」と言い、惚れ込む。もちろん、翻訳の質を高める教育係として、テキストの誤訳を精査するプロの翻訳者や言語学者の後方支援チームがいることは言うまでもない。
同社のニューラルネットワークの設計にあたるのは、リサーチャー約50人とエンジニア約120人による技術チームだ。現在の機械学習レベルは、全体を俯瞰して内容を把握したうえで、1文ずつ訳し、原文に戻ってチェックするプロの翻訳者の領域に到達する。
クテロフスキーは前職のオンライン辞書開発会社Lingueeで蓄積した膨大なデータテキストにかかわるうちに、機械学習を活用した翻訳サービスの着想を得てここまで来た。技術は常に進化している。DeepLが得意とする全文翻訳は、glossary(用語集)を高度にパーソナライズすることでさらに精度が上がるという。
5年先、10年先の機械翻訳ツールは大きな変化を遂げているはずだ、とクテロフスキー。「私は数学者ですから、あやふやな未来の予測は言えません。ただ、確実に言えるのは、私たちはこれでもまだ頂上に到達していないということです」
ヤロスワフ・クテロフスキー◎ポーランド生まれ。コンピュータサイエンスの博士号をもつ。独の大学でのリサーチ職、ボーダフォンなどを経て、オンライン辞書のLingueeでCTOを務めた後DeepLを起業。