photo by iStock

「急速に進化した機械翻訳」に、それでもできない3つのこと

翻訳者には、失業の心配はありません

ここ2年で、機械翻訳の精度が大幅に改善している。

現時点でも完全にはほど遠いが、以前は文章の体をなしていなかったものが、かなり意味の通る文になってきた。我々が海外から受け取るメールやアプリの説明書きなども、機械翻訳されたものが多くなってきている。必ずしも自然な日本語ではないが、とりあえず「読める」「わかる」ものになり、実用的になったからこそ利用が進んでいるのだろう。

また、カメラで撮影した画像の中に含まれる言葉を機械翻訳してくれるアプリも登場している。

拡大画像表示カメラで撮影すれば、文字を認識して翻訳してくれるアプリも。写真は「Microsoft Translator」。どのスマホからも無料で使える。

画像中に含まれる文字情報だけを抽出して、多言語に翻訳してくれるもので、旅行中に看板などを撮影して、そこに書かれている内容を把握する際などにとても便利なサービスだ。音声を聞き取って、翻訳したうえで自国語で話してくれる「ほんやくコンニャク」のようなアプリも登場している。かつて憧れたドラえもんの道具が、形を変えて実現しつつあるといえよう。

 

このような変化の背景にあるのは「ディープラーニング(深層学習)」である。ご存じのとおり、昨今は「AI」(人工知能)として、ひと言でまとめられてしまうことも多い概念だ。

ディープラーニングの登場で、機械翻訳はどう変化したのか? 何が起きていて、どんな限界があるのか? あらためて読み解いてみよう。

急速に進化する「ディープラーニング型」機械翻訳

AIという言葉は、決して新しいものではない。

コンピュータの歴史は「人工知能」探求の歴史でもあり、これまでにも何度かAIブームが起きてきたが、現在のブームは「ディープラーニングのブーム」といっても過言ではない。

ディープラーニングがどういう技術で、機械翻訳にどんな役割を果たしているのか? それは、言葉の「意味」をどう考えるか、という点で表すことができる。過去との比較で語ったほうがわかりやすいだろう。

機械翻訳ではもともと、文章や単語のもつ具体的な意味にはいっさい踏み込んでいなかった。用例をもとに読み替え、翻訳していく。「今日は晴れです=Today is sunny day」といった相互に対応する文例を多数用意し、逐一置き換えを行う「辞書的翻訳」だったのだ。それはまさに“機械”的な翻訳であり、置き換えの情報をひたすらつくっていく必要があることから、翻訳の精度を上げるのが困難だった。

そこで登場したのが「統計的機械翻訳」だ。

大量に文例を集めたうえで各単語を記号化し、統計処理に基づいて機械的に処理していくことで、翻訳のためのデータベースができ上がる……というしくみだ。単語はあくまで記号として扱われるため、どんな意味の文書が処理されているのか、ソフトウエア側はまったく把握していない。

そこに大きな変化が起きた。きっかけとなったのは、2014年にグーグルが発表した「自動翻訳にディープラーニングを活用する」という論文である。この論文をもとに、2年ほど前から、ネット上の機械翻訳サービスは、ディープラーニングを使ったものへと切り替えが進んでいる。

コンピュータの歴史は「人工知能」探求の歴史でもあった photo by iStock

ディープラーニングは「言葉の意味」を学習しない

ディープラーニングは現在、俗に「AI」とよばれる技術の中核となっている考え方だ。「大量の情報と答えの例から人間が学ぶのに近いやり方でひたすら学習して、ルールを自動的につくる」方法、と説明することができる。その結果、従来はルール化が難しかった、非常にあいまいなものを判断するソフト開発に向いている。

画像認識や音声認識にも活用され、「猫を見分ける」「人の顔を見分ける」「声を認識する」といった処理の精度が劇的に向上している。冒頭で、カメラの画像から文字の部分だけを翻訳する例を紹介したが、これも、画像認識・文字認識の能力が、ディープラーニングの導入で格段に向上したことによる成果だ。

こうしたしくみを自動翻訳におけるルール作りに使ったのが、現在主流となりつつある「ディープラーニングによる自動翻訳」である。とはいえ、このディープラーニングにおいても、「AI」という言葉から想起されるような「意味の解釈」は行われていない。

だが、「意味をふまえる」ことには一歩踏み込んでいるのが特徴だ。ディープラーニング・ベースでの機械翻訳では、語感や語順など、文章の流れも考慮したうえで「どういう空間にどういう情報とともに配置されるか」を重視している。

たとえば「匙(さじ)」と「スプーン」は、ディープラーニングによる学習の結果、近い空間に、似た情報をもって存在するのだという。だから「両者は似たような意味である」と判断されて、翻訳に使われる。翻訳対象となる文章が多いほど、そうした判定の精度が向上しやすいため、文章を見ると「意味をふまえて、従来よりも自然な文章ができ上がっているように見える」のだという。

これが、ディープラーニングで機械翻訳の精度が上がった理由である。

各社は現在、機械翻訳用のエンジンをディープラーニング・ベースに置き換えているが、それにもやはり理由がある。各社がディープラーニングを支持しているのは「まだ伸びしろが大きい」からなのだ。

統計的機械学習などの過去の手法は、おおむね20年にわたって研究されてきた。各社の評価として、統計的機械学習による翻訳精度の向上は「踊り場状態」にあり、近い将来に劇的な成長を見込める状態にはない。

だが、ディープラーニングによる翻訳は、論文の発表から実用化まで、わずか2年ほどしか研究されていないにもかかわらず、すでに統計的機械学習による翻訳の精度を超えている。しかも、まだまだ向上の余地がある。そのような将来性に対する評価から、各社はいっせいにディープラーニング・ベースへと舵を切ったのである。

大量の情報と答えの例から人間のように学習しルールをつくるディープラーニングが短期間に広まった photo by iStock