トップページ > vol.141 進歩が止まらない機械翻訳
進歩が止まらない機械翻訳
vol.141

この10年で一気に加速
進歩が止まらない機械翻訳

人工知能(AI)の進化によって、言語の壁が崩れつつあります。プライベートや仕事でも、外国語で書かれたメールや文書の大意を素早くつかむために、Google翻訳、DeepLなどの翻訳ツールを頼りにしているという人は多いのでは? 調査によっては数十億ドルの市場規模とされる機械翻訳の世界を覗いてみましょう。

「人間のほうが良い」と研究がストップ!?

 コンピュータを使った機械翻訳の研究は、東西両陣営で翻訳の必要性が高まった冷戦時代に本格化しました。1949年、機械翻訳の父とされる米国のウォーレン・ウィーバーが「Translation」という覚書を発表。暗号技術を応用することで逐語的な翻訳にとらわれない機械翻訳の原理をまとめた覚書は、この分野の方向性を決定付けたといいます。
 1954年には米ジョージタウン大学の研究チームとIBMが共同で、250語の辞書と6つの文法規則を使ってロシア語49文を英語に翻訳するデモを行い、大きな反響を呼びました。このデモによって機械翻訳の可能性が注目され、研究への財政支援も増加しました。
 しかし、1950年代も終わりになると実現可能性を疑問視する声が聞かれるようになり、1966年にはALPAC(自動言語処理諮問委員会)と名付けられた諮問委員会のレポートが発表されます。このレポートでは、機械翻訳の研究は早期に成果が得られるものではないとしながらも、人間に翻訳させたほうがコストを低く抑えられるなどと結論付けたため、資金援助が大幅に削減される要因になりました。結果的に、米国における機械翻訳の研究は停滞を余儀なくされてしまったのです。

日本や欧州の研究が米国にも好影響

 ALPACレポートの影響が少なかった日本や欧州などでは、機械翻訳の研究は継続されました。英語とフランス語が公用語のカナダでは、国内の研究所が開発した機械翻訳システムを用いて、膨大な情報量の天気予報を翻訳しました。このシステムは特定の分野なら機械翻訳に実用性があることを示し、1977年から2002年まで運用されたといいます。
 日本では1980年代に国家プロジェクトとして、論文抄録の日英機械翻訳システムの研究開発が推進され、国内メーカー各社による開発競争も本格化しました。こうした研究の進展は米国にも影響を与え、コンピュータ性能の向上や、大量の対訳情報を記憶させて統計的な手法で翻訳する統計的機械翻訳(SMT)の登場などによって、米国でも機械翻訳研究が再びさかんになりました。
 ただし、機械翻訳の世界が一変するのは2010年代に入り、ディープラーニング(深層学習)を活用したニューラル機械翻訳(NMT)が登場してから。統計的機械翻訳では翻訳が難しかった言語間でも人間並みの自然な翻訳が可能になり、実用性が飛躍的に向上しました。

世界を驚かせたニューラル機械翻訳

 ニューラル機械翻訳では、人間の脳の構造をコンピュータ化したニューラルネットワークを使ったディープラーニングの活用で、従来の統計的機械翻訳で課題だった文全体の文脈を捉え、より自然で適切な訳文の生成が可能になりました。
 これが実用化された身近な事例は、2016年のGoogle翻訳への採用でしょう。2006年からサービスを提供していたGoogle翻訳は、ニューラル機械翻訳の導入を契機にその精度を大きく向上させました。翌年の2017年にサービスを開始したDeepLもニューラル機械翻訳を利用し、Google翻訳を凌ぐ自然な翻訳ができると高評価を受けました。同年にはTransformer型と呼ばれる新しい構造も登場。処理速度を高め、多言語対応や低リソース言語の精度の改善が進みました。
 現在では技術文書の翻訳から多言語対応のチャットボット、観光や医療分野まで幅広く技術が活用され、ECサイトの自動翻訳や公共交通機関の多言語案内など、その存在に気付かないまま私たちが利用しているケースも多くあります。一方で、部分的に翻訳をスキップしてしまう、文脈に合わない過剰な意訳をしてしまう、新語に対応できない、分野により精度に差があるといった課題もあり、文化的背景や言外の意味まで考慮した過不足のない翻訳までは依然として難しいのが現状のようです。

勝手に予言を託宣!? 虚実ないまぜの機械翻訳

 ニューラル機械翻訳の課題のひとつに、ソース言語(原文)にない情報を勝手に生成したり、誤った情報を追加したりする現象があります。

過去にはこんなことが……

大阪メトロの公式サイトで新着情報を外国語に自動翻訳したページで、「堺筋線」を「Sakai Muscle Line」などとする誤訳が見つかり、その信頼性が疑問視されてページが一時非公開に……(2019年)


Google翻訳で「dog」という単語を一定回数入力し、それをマオリ語から英語に変換するように設定すると、世界の終末を予言するような文章が生成される。ほかの単語や言語間の組み合わせでも謎めいた文章が生成されてSNSを賑わせた……(2018年)


イスラエルで、パレスチナ人がアラビア語で「おはよう」とSNSに投稿したところ、自動翻訳の誤りで「やつらを攻撃せよ」とヘブライ語に誤訳されてしまい、誤認逮捕される事態に……(2017年)

 訳文が原文とかけ離れている様子が幻覚と似ていることから、こうした現象は「Hallucination(幻覚)」と呼ばれ、深層学習に用いるデータの不足や質の問題、システムが過度に文脈を推測しようとする傾向などが要因とされています。

人類の夢は実現する……?

 機械翻訳の技術は、たとえ間違いがあっても頼りになるまでに進化し、まさに「ドラえもん」のひみつ道具「ほんやくコンニャク」の世界が現実のものになりつつあります。とはいえ、いくら技術が進歩しても「動物との意思疎通」となると、まだまだ難しいのが現実。最後に、そんな難問に果敢に挑戦(?)した懐かしの取り組みを振り返ってみましょう。
 2002年、日本のタカラ(現タカラトミー)が発売した「バウリンガル」は、犬の気持ちを翻訳するというユニークな発想のガジェットでした。犬の首輪に装着した小型ワイヤレスマイクから鳴き声をリアルタイムで声紋分析し、6種類(フラストレーション・威嚇・自己表現・楽しい・悲しい・欲求)の感情に分類して人間の言葉に翻訳するというもので、国内外で30万台を出荷するヒット商品になり、ノーベル賞のパロディとされるイグノーベル賞の平和賞も受賞しました。翌年には猫の鳴き声を分析する「ミャウリンガル」も登場。スマホが普及してからも、犬語や猫語を翻訳するアプリが登場し、愛犬家や愛猫家を楽しませています。

動物の鳴き声の翻訳がどれほどなのか、その精度の検証は実際には難しいものの、「意思疎通したい」という人々の願いが思いも寄らないアイデアにつながることも。日進月歩の機械翻訳の世界では、これからどんなイノベーションが起きるのか楽しみですね。

参考文献(順不同)
ティエリー・ポイボー『機械翻訳:歴史・技術・産業』(森北出版)/VICE(ホームページ)/朝日新聞(同)/日本経済新聞(同) 等

★WebマガジンTrace[トレース] 更新終了のお知らせ

平素はWebマガジンTrace[トレース] をご愛読いただき、誠にありがとうございます。
2013年4月の発行以来、多くの皆様にお読みいただきましたが、今号(vol.141)をもちまして更新を終了いたします。
長きに亘りご愛読、ご支援をいただきました読者の皆様に心より御礼申し上げます。

PageTop