「急速に進化した機械翻訳」に、それでもできない3つのこと

翻訳者には、失業の心配はありません
西田 宗千佳 プロフィール

「ニュアンス」「非言語」に踏み込めない機械翻訳

では、機械翻訳は今後、どこまで精度を上げられるのか? 

「おそらくすぐに、中学生レベルの英語は不要になるだろう」と、研究者の意見は一致している。また、記述のルールが定まった文書、たとえば特許文書や法律、論文といったものであれば、翻訳の精度は相当に高くなっていくだろう。書く側が「機械翻訳に配慮」し、文学的な(少々あいまいなニュアンスを含む、と言い換えてもいい)表現を使わずに書かれた文章も、翻訳精度は高くなる。

 

その先にはいずれ、翻訳者が不要になる時代が来るのだろうか?

研究者の間では、「そうはならないだろう」という意見が共通の見解となっている。

理由は複数ある。

機械翻訳が役に立たない、と関係者の意見が一致するのが「小説」「シナリオ」の類いだ。なぜこれらのコンテンツの翻訳に使えないかというと、ディープラーニングでは単語の大まかな意味は扱っていても、「文章の意味」そのものを解釈して翻訳しているわけではないからだ。

「おまえはバカだ」という同じ文章でも、その意味するところは、前後の文脈で大きく異なる。そのニュアンスをとらえて文章全体を翻訳するのは、現在のディープラーニング機械翻訳では難しいのだ。

機械学習ならではの問題もある。たとえば、ある文章中に登場する女性であるはずの人物を「彼」と誤訳する例があったという。間違えた理由は、その人物の職業には一般に男性が就くことが多いことから、サンプルとなった文章から「その職業の場合には男性形で訳す」という誤った学習をしてしまっていたからだ。

学習の結果はつねに正しいとは限らず、そのような部分を指摘して修正するのは当然、人間の仕事になる。ディープラーニングの「誤まった学習結果」の洗い出しは今後、大きな課題になるはずだ。

もうひとつ、本質的な問題がある。

たとえば現在の機械翻訳では、同時通訳の精度は高くない。まず音声をテキスト化し、その後に翻訳するという流れになるため、「テキスト化」と「翻訳」という2つの関門があり、そもそも不利であるのは否めない。しかし、ディープラーニングによる音声認識の登場により、「テキスト化」の精度は格段に上がっている。問題は、「テキストから翻訳する」ことそのものに起因している。

人の会話内容(話し言葉)は、文章(書き言葉)に比べて非常に粗い。言葉が抜け落ちたり、語順がおかしかったり言いよどんだり、あらためてよく考えると意味が通じていなかったりもしている。人間どうしの会話なら、そこからうまく意味を汲み取ることができる。それに近いことができるAIが登場しなければ、同時通訳の精度は決して上がらない。

また、同じコミュニケーションであっても、「テキストだけ」の場合と、「音声での通話」、さらに「実際に対面しての会話」とでは、誤解が生じる可能性がまったく違ってくる。人間は、非言語でのコミュニケーションも活用しており、特に同時通訳者は、そうしたニュアンスも汲み取って翻訳する。

たとえば英語圏の人物が、ある単語を話しながら両手の人差し指、中指、親指で挟み込むようなジェスチャーをしたら、クオーテーションマーク(“ ”)で単語を括った、というニュアンスがあることから、即座に「いわゆる」という言葉に置き換えるというが、テキスト情報だけに頼る機械翻訳では、そうした部分のカバーは難しい。

人間は非言語でのコミュニケーションも活用しており、同時通訳者はそうしたニュアンスも汲み取って翻訳する photo by iStock

声優の名演も台無しに

先ほどの、「おまえはバカだ」というフレーズにしても、「おまえは……、バカだ!」というふうに言った場合と、「おまえは、バ・カ・だ」と愛嬌のある声で言ったときとでは、まったくニュアンスが異なる。たとえば映画の吹き替えでは、当然それらのニュアンスの違いを把握したうえで台本がつくられている。だが、声優によるせっかくの演技も、機械翻訳では平板な言葉に置き換えられてしまうだろう。

「言葉」はそもそも、それが使われている国の文化に根ざしている。同じ言葉・会話であっても、国によって実際に人が受け取るニュアンスが違うことも多いが、現在の機械翻訳は、そのようなニュアンスを誤訳しやすい傾向にある。

なぜなら、現状の翻訳エンジンは、各国の文化的背景までは考慮に入れていないからである。こうした要素は、実は人間でも誤訳に結びつきやすい一因なのだが、それは機械翻訳でも変わらない。

翻訳の精度が上がってきたことで、あらためて気づかされるのは、人間はいかに多彩な情報を用いて、複数の角度から「言葉」を使っているか、ということだ。現在の機械翻訳は、どうしても「目の前のテキストの内容を解釈しての翻訳」に特化している。だからこそ、細かなニュアンスを必要とする翻訳は苦手なのである。

ここで列挙したような問題も、いずれは技術のさらなる進展によって解決されるのかもしれない。しかし、少なくとも当面は無理だ。したがって現時点では、機械翻訳は「カジュアルに、多少の間違いを許容しつつ使う」、あるいは「企業内での下訳に使う」のが現実的な利用法だろう。

限定的な使用環境であることは否めないが、それでも機械翻訳は、人間に比べて圧倒的にコスト効率が高く、コミュニケーションの助けになることも間違いない。東京五輪を控え、海外からの渡航者が増加傾向にある今の日本で、「会話の糸口くらいはつかめる」ことのメリットは十分にある。

機械翻訳はあくまで「ツール」だ。ツールが便利かどうかは結局、使う側が決めることである。やがて我々の文化や言葉のニュアンスまで読みとるAIが登場してくれば、興味深い「パートナー」になりうるだろうが、それはまだ、かなり先の出来事である。

機械翻訳は,「会話の糸口をつかむ」などの、コミュニケーションの助けになることも間違いない photo by iStock
※本記事を執筆した西田宗千佳さんのおすすめ書籍はこちら。

すごい家電 いちばん身近な最先端技術
 定価1100円(税別)

暗号が通貨になる 「ビットコイン」のからくり
(吉本 佳生氏との共筆)
 定価1000円(税別)