「存じ上げません」を「Zonjiage not」と翻訳するなど、ネタにされることも多いGoogle翻訳ですが、11日ごろに翻訳精度が大幅に向上したと大きな話題になっています。
Google翻訳の精度が向上したのは、9月に中国語→英語翻訳に導入された新しい翻訳方式のニューラルネットワーク機械翻訳が日本語→英語翻訳にも導入されたことが要因のようです。
新しい翻訳方式はサーバー上で更新されているため、すでにスマホアプリでも翻訳精度が大幅に向上しているようです。新しい翻訳方式の実力を確かめるために過去に話題になった「今に見てろ」→「Mitero now」などの“珍訳”を再翻訳してみました。
Google翻訳の精度が向上、ウェブ版またはスマホアプリから
Google翻訳の精度が改善されたのは日本語→英語のみです。また、検索結果から利用できる翻訳機能には今のところ新しい翻訳方式が適用されてないようです(11/12 15:00時点)
精度が向上したGoogle翻訳を体験したい場合はウェブ版のGoogle翻訳にアクセスするか、スマートフォンのGoogle翻訳アプリをダウンロードしましょう。というわけで珍訳を再翻訳してみました。
「今に見てろ」→「Mitero Now」
日本語のMiteroがLookに翻訳されるようになりました。なお、英語では「Just you wait.」と表現するようです。
「ご査収ください」→「Please be Sashu」
こちらも日本語のSashu/サシューが英語に翻訳されるようになりました。
「お腹空いてませんか」→「Do not you hungry?」
ピザハットのパンフレットで話題になった誤訳も改善されました。
Hungryは形容詞だぞ…大丈夫か、ピザハット?本社から怒られるぞ…。 pic.twitter.com/iHiwGRbsAJ
— Kazuto Suzuki (@KS_1013) 2016年4月29日
「壊れかけのradio」→「Kowarekake Radio」
改善されているものの、ラジオが完全に壊れました・・・
「左様でございます」→「There a Hidarisama」
新しい翻訳をもってしても少し意地悪になると難しいようです。
「よりどりみどり」→「Yoridori Green」
「瓜二つ」→「Melon Two」
「鬼に金棒」→「Kanabou to demon」
「加藤一二三」→「Kato, one hundred twenty-three」
将棋棋士の加藤一二三さん。無茶苦茶な翻訳から多少改善したものの今度は別人になっています。
翻訳精度が向上したのは文章系?
ニューラルネットワーク機械翻訳の仕組みは、ニューラルネットワークを使って翻訳前の単語をベクトルに変換したあと、ベクトル間の関連性に注意しながら復元を行い、それを元に翻訳を行うことで翻訳精度の向上を実現しているようです。
大切なのは「ベクトル間の関連性」でしょうか。おそらく、単語が多い文章などは翻訳精度が大幅に向上しているものと思われます。一方、“珍訳”をニューラルネットワーク機械翻訳で再翻訳した結果、多少の改善が確認されたものの大幅な改善が確認できなかったのは単語が少ない=ベクトル間の関連性が少ないことが原因かもしれません。
Twitterでも長文の翻訳精度が向上したとの報告例が多い気がします。
Neural Machine Translation(NMT)を大まかに説明すると、ある言語の単語を系列データとして固定長のベクトルに置き換え、それを別の言語の系列データに変換する「エンコーダ・デコーダ」モデルをニューラルネットワークで行うというものだ。デコーダは元の言語のベクトル間の関連性の重みに注意を払いながらデコードする。
- 引用元
- ITmedia ニュース