テクノロジー

2022.08.21 08:30

ドイツの機械翻訳「DeepL」は文学も訳せるか? 芥川龍之介作品で試した

Getty Images

Getty Images

機械翻訳において鉄板となってきていたグーグル翻訳。だが、その精度を遥かに凌ぐ技術との呼び声が高いのが、2017年にサービスを開始したドイツ発のニューラル機械翻訳サービス「DeepL」だ。
-->
advertisement

訳文が返されるまでのスピード感が格段な上に、微妙なニュアンスにも対応する。さらに、訳しにくいところは「うまく飛ばす」「ごまかす」といった人間的な忖度まですることがある印象だ。DeepL翻訳が他の技術に大きく水をあけているといわれる理由もそのあたりにありそうだ。

さて、このDeepL、広くビジネスの世界では実用化されているが、「文学」を訳させてみたらどうなるのだろうか。そして、日本語特有の「読み仮名」(英語、その他にも「発音記号」は存在するが、役割は同じではない)、あるいは旧字「ゐ」や、旧仮名遣い(たとえば「なすつたやうに(なすったように)」)は、DeepLが採用するアーキテクチャにどの程度ネガティブな影響を与えるのだろうか。

それらを、古典中の古典、芥川龍之介の作品で試行してみた。
advertisement

結果からの専門的な精査は筆者の力量にあまるが、「読み仮名」、「旧字」のあるなしで微妙な結果が得られたことを以下共有し、読者諸氏のご参考としたい(元テキストには「青空文庫」を利活用させていただいた)。

まずは青空文庫から、「かちかち山」をダウンロード


まず以下が、「青空文庫 図書カード:No.3814」芥川 龍之介『かちかち山』である(便宜上、元のテキストにはない[1文目]、[2文目]、のナンバリングをほどこした)。



[1文目]童話時代のうす明りの中に、一人の老人と一頭の兎(うさぎ)とは、舌切雀(したきりすずめ)のかすかな羽音を聞きながら、しづかに老人の妻の死をなげいてゐる。

[2文目]とほくに懶(ものう)い響を立ててゐるのは、鬼ヶ島へ通(かよ)ふ夢の海の、永久にくづれる事のない波であらう。

[3文目]老人の妻の屍骸(しがい)を埋めた土の上には、花のない桜の木が、ほそい青銅の枝を、細(こまか)く空にのばしてゐる。

[4文目]その木の上の空には、あけ方の半透明な光が漂(ただよ)つて、吐息(といき)ほどの風さへない。
 
[5文目]やがて、兎は老人をいたわりながら、前足をあげて、海辺につないである二艘(にさう)の舟を指さした。

[6文目]舟の一つは白く、一つは墨をなすつたやうに黒い。

[7文目]老人は、涙にぬれた顔をあげて、頷(うなづ)いた。


「漂(ただよ)つて」「二艘(にさう)」など、読みがカッコ内表記されている上、その読みが旧仮名遣いで表記されており、難易度のきわめて高い訳し元文に見える。

この元テキストをDeepLでまずは「英語」に訳したものをもとに、また日本語に訳し戻す(重訳)を試みてみた。ついで、元テキストからカッコ内の「読み仮名」を削除し、「旧字(旧仮名遣い)」を現代表記に直して英訳したものをもとに、また日本語に訳し戻してみた。

すなわち、

青空文庫からダウンロードした元テキスト、カッコ内に「読み仮名」、ならびに旧仮名遣いあり----------1

DeepLでまずは「英語」に訳してから和訳したもの---------2

元テキスト(1.)からカッコ内の「読み仮名」を削除し、「旧字(旧仮名遣い)」を現代表記に直したものを「英語」に訳してから和訳したもの---------3

の2.と3.の違いについて結果を比べてみたわけだ。以下、少しだけ気づいた点を引用しよう。
次ページ > 2文目の「訳ブレ」

構成=石井節子

タグ:

advertisement

ForbesBrandVoice

人気記事