2021.11.25
# 人工知能

Google翻訳よりも高性能? AI翻訳「DeepL」の驚異的な実力

とても「自然な翻訳」になる理由

人間が脳内で自然にやっている“文脈で見分ける”という作業も、AIにとっては莫大な手間がかかる。

「例えば『Aさんはペットショップで小鳥を買った』という文があったとします。このとき『Aさんがペットショップで買った』という文だったとしても、多くの人は買ったものが動物だと想像できますよね。しかし、これまでのAIはここに野菜など程遠いものを持ってきてしまう可能性をなかなか排除できませんでした」

裏を返せば、ようやく「動物を買った」と問題なく判定できるようになるまで、AIが発達してきたということだろう。

 

カギは「良質なデータ」にあった

そのような近年のAI翻訳のなかでも、なぜDeepLはGoogle翻訳よりも優れていると称されるのかを伺おう。

「実はDeepLの具体的な仕組みは公開されていません。ですから、ここから申し上げることは最新の技術潮流からの予測です。

そのうえで言えるのは、まずDeepLの翻訳システムの根底になるAI技術は、Google翻訳と大きく変わらないでしょう。さらに言うなら、世界中の研究機関などで用いられている今のAI翻訳技術のベースは、どれもあまり変わらない。

Photo by iStock

では、何がそれぞれの翻訳サービスの質を分けているのか。それは良質の学習データをたくさん所有しているかどうかでしょう。DeepL GmbHという会社は、もともと『Linguee(リンギー)』という、プロ翻訳者に対訳データを提供するサイトを運営していました。この運営経験のおかげで、利用者であるプロ翻訳家から収集した質の高い対訳データを大量に保有していたのです。

また、同社は“クローラー”と呼ばれる、ネット上に転がっている原文と対訳データを紐付けて収集する技術も開発しており、これを駆使して多くのデータを集めていたことも大きいでしょう」

関連記事

おすすめの記事