AI翻訳が人間超えってホントなの?

こんにちは、ダメっ子のぴぴおです。

この間、日経新聞の電子版に『AI翻訳「人間超え」へ 技術が急発展』という記事が掲載されていた。

AI翻訳が信頼できるようになれば、便利な世の中になる。しかし翻訳者の僕としては、機械翻訳の技術の発展は仕事を失うことにつながりかねないので脅威である。

Google翻訳が数年前にニューラル機械翻訳(NMT)を採用して以来、機械翻訳の質が一気に高まったことはよく知られている。それまでは、英語を日本語に訳した場合、日本語として意味を成さない文になることが多かったが、今はたいてい、読んで意味が分かる文になる。これは大きな違いだ。

しかし、過去の記事にも書いたことがあるが、訳文の内容には大きな問題があり、そのまま使うことは難しい。訳文を一見するときれいな日本語に見えるが、原文と比べてみると、重要な要素が欠けていたり、内容が正反対だったりすることが頻繁にあるのだ。

だが、日経の記事によると、中国語のニュース記事を英語に翻訳するマイクロソフトのモデルが2018年に「人間(=プロ翻訳者)並み」の訳文作成を実現した。今年8月の国際会議では、別のモデルによる英語からドイツ語への翻訳で「人間超え」が報告されたという。

日本語と英語ではどうかというと、情報通信研究機構(NICT)のモデルを採用した「みらい翻訳」が高精度の機械翻訳を実現しているそうだ。

記事にはこう書いてある。

日本語から英語への英作文の情報伝達力が、英語でのコミュニケーション能力のテストであるTOEICで960点のビジネスパーソンに並ぶ水準に到達。流ちょうさの点でもプロ翻訳者にほぼ並んだ。ただし、英語から日本語への英文和訳では流ちょうさでプロ翻訳者にわずかに及ばないという。

まぢか?

みらい翻訳は、ウェブサイトでお試し翻訳ができるので、何ヵ月か前に試してみたことがある。確かに機械でここまでできるのはすごいと感心したが、やはりGoogle翻訳と同じ問題があり、信頼できる精度ではなかった。しかしAI翻訳の技術は日々急速に進歩しているそうなので、この数ヵ月で一気に改善したのかも。

そこで、またサイトにアクセスして、試しにWall Street Journalの記事の一部を翻訳させてみた。

まずはできあがった訳文を見てみよう。

米財務省によると、米国は、ベネズエラの石油部門に対する制裁を強化し、ベネズエラからキューバに石油を輸送したとして、4つの企業と4隻の関連船舶をブラックリストに載せた。

この指名は、1月にニコラス・マドゥロ政権を崩壊させ、野党指導者フアン・ガイドー氏に権限を与える動きの中で、米国の重要な収入源である国営石油会社ペトロレオス・デ・ベネズエラSAがブラックリストに載せられたことを受けたものである。

ムヌチン米財務長官は、「マドゥロのキューバ人支援者は政権の命綱となり、抑圧的な安全保障と諜報機関を可能にする。」と述べた。

財務省は、PdVSA、キューバの国営石油輸出入会社Cubametales、キューバ当局者らとの協定の一環として、ベネズエラの石油製品をキューバに引き渡したとされる3隻の船舶を運航している、キプロスを拠点とするCaroil Transport Marine Ltd.に対して制裁を科した。財務省はまた、カーオイルトランスポートマリーンが運航する2隻の船舶の登録所有者であるパナマに拠点を置く2社をブラックリストに載せた。

ほー、日本語の文章として形式上破綻していないし、結構、新聞記事っぽい。やるじゃんか、と思うかもしれないが、細かく見ていこう。

第一パラグラフの原文は、次のとおり。

The U.S. imposed more sanctions targeting Venezuela’s oil sector, blacklisting four entities and four related vessels for allegedly transporting oil from Venezuela to Cuba, the Treasury said on Tuesday.

訳文も改めて表示する。

米財務省によると、米国は、ベネズエラの石油部門に対する制裁を強化し、ベネズエラからキューバに石油を輸送したとして、4つの企業と4隻の関連船舶をブラックリストに載せた。

原文では文末にある ”the Treasury said…”を、訳文では文頭に持ってきて「米財務省によると」としたり、”imposed more sanctions”を「より多くの制裁を科した」といった逐語訳ではなく「制裁を強化し」と、こなれた表現にしている点などは評価できる。しかし原文の最後の”on Tuesday”の情報が欠如している。

次は第二パラグラフ。

The designations come after the U.S. blacklisted state-owned oil company Petroleos de Venezuela SA, an important revenue generator for the country, in January, in a move to cripple Nicolas Maduro’s government and empower opposition leader Juan Guaido.

訳文は以下のとおり。

この指名は、1月にニコラス・マドゥロ政権を崩壊させ、野党指導者フアン・ガイドー氏に権限を与える動きの中で、米国の重要な収入源である国営石油会社ペトロレオス・デ・ベネズエラSAがブラックリストに載せられたことを受けたものである。

原文の”in January”は”the U.S. blacklisted”にかかるのだが、訳文の「1月に」はどこにかかるかよく分からない。普通に読むと「崩壊させ」にかかるような印象も受ける。

それから、”an important revenue generator for the country”を「米国の重要な収入源である~」と訳している。”the country”を「国」または「その国」とせず「米国」としたのは、機械翻訳としては素晴らしい対応なのだが、残念ながら、ここでthe countryが意味しているのは、この話で出てくるもう一つの国、すなわちベネズエラのことだ。この訳文では、ベネズエラの国営石油会社が米国に利益を生んでいることになっている。どんな利権が働いているんだろうと勘ぐってしまう。ちなみにJuan Guaido氏の名前は、日本の報道機関では「フアン・グアイド」と表記されている。

次に第三パラグラフ。

“Maduro’s Cuban benefactors provide a lifeline to the regime and enable its repressive security and intelligence apparatus,” Treasury Secretary Steven Mnuchin said on Tuesday.

訳文は以下。

ムヌチン米財務長官は、「マドゥロのキューバ人支援者は政権の命綱となり、抑圧的な安全保障と諜報機関を可能にする。」と述べた。

この部分はちょっと難しいのかもしれないが、機械翻訳の訳文は一読したところ意味不明。「キューバの支援者たちがマドゥロ政権の命綱となっており、そのおかげで同政権は強圧的な治安・諜報機関を維持できている」というのが財務相の発言の意味だろう。原文を読んでから訳文を読むと、文の構成はかなり正確につかめていることが分かるが、Maduro’s Cuban benefactorsとenable … apparatusの訳出がこなれていなかったため、意味が取りにくい訳文になった。また、最後のon Tuesdayがここでも訳されていなかった。

ちなみに、再び固有名詞の話になるが、Mnuchinは、日本の報道では「ムニューシン」と表記されている(当初は揺れがあったが今はこれで統一されている)。この名前、アメリカ人にとっても読み方が難しいらしく、米国のテレビやラジオのニュースを聞いても、ムニューチンだったり、ムニューシンだったり、定まっていない。確か財務長官に就任した当初、国会(上院か下院か忘れた)で議長に「あなたの名前はなんて読むの?」と質問されて、「ムニューシン」と答えていたので、日本のマスコミはその表記に落ち着いたのだと思う。

第四パラグラフ。

The Treasury levied sanctions on Cyprus-based Caroil Transport Marine Ltd., which operates three vessels that the Treasury alleged recently delivered Venezuelan petroleum products to Cuba as part of an arrangement involving PdVSA, Cuba’s state-run oil import-and-export company Cubametales and Cuban officials. The Treasury also blacklisted two Panama-based companies that are the registered owners of two of the vessels operated by Caroil Transport Marine.

訳文は以下。

財務省は、PdVSA、キューバの国営石油輸出入会社Cubametales、キューバ当局者らとの協定の一環として、ベネズエラの石油製品をキューバに引き渡したとされる3隻の船舶を運航している、キプロスを拠点とするCaroil Transport Marine Ltd.に対して制裁を科した。財務省はまた、カーオイルトランスポートマリーンが運航する2隻の船舶の登録所有者であるパナマに拠点を置く2社をブラックリストに載せた。

この原文は、第一文のCaroil Transport Marine Ltd.にかかる部分が長い。意味を捉えるのはさほど難しくないのだが、修飾句がこれだけ長いと、そのまま訳した場合、日本語として理解が難しい文になってしまう。機械翻訳の訳文は長い修飾句のかかりを完璧に判断している。しかも、「3隻の船舶を運航している、キプロスを拠点とするCaroil Transport Marine Ltd.」と「運航している」の後に「、」を入れて、これがキプロスではなくCaroil Transport Marineを修飾していることを表す工夫も施されている(ちなみに僕個人としては、このやり方はできるだけ避けている)。この辺は見事であるが、やはり一読したときに意味が取りにくいので、僕なら、「米財務省はキプロスを拠点とするCaroil Transport Marine Ltd.に対して制裁を科した。同社はPdVSA、キューバの国営石油輸出入会社Cubametales、キューバ当局者らとの協定の一環として、ベネズエラの石油製品をキューバに引き渡したとされる3隻の船舶を運航する」といった具合に二つの文に分けるかな。

また、原文中のrecentlyが訳出されていなかった。Caroil Transport Marineの社名が最初は原文表記で、2回目はカナ表記という表記揺れの問題もあった。

さて、全体を通して見ると、機械翻訳の精度が大きく向上しているのは分かった。しかし、今回検証した英日翻訳で、情報伝達力と流ちょうさにおいてプロ翻訳者に迫るかと言えば、まだそこまで行っていないような気がする。the countryをベネズエラではなく米国としたところは、原文の意味を大きく損なう判断であるし、軽微な訳抜けもあるので、情報伝達力はまだ完璧ではない。

それでも、AI翻訳が今後に期待できる技術であると同時に、翻訳者にとって脅威になるということも分かった。

どうしたら今後もAI翻訳に対して優位性を保てるか研究することも大事だな。

にほんブログ村 その他スポーツブログ マラソンへ
にほんブログ村

にほんブログ村 その他スポーツブログ マラソン(サブスリー)へ
にほんブログ村

にほんブログ村 英語ブログ 英語 通訳・翻訳へ
にほんブログ村

楽天イベント情報