GCL特別講義IVの12回目:自分の発表「DeepLのポテンシャルと現在の限界 」

はじめに

GCL特別講座のAIのユーザとしての第12回講義と第13回講義は、学生による発表だ。自分は、今日の25名中の22番目だった。発表の順番まで時間があるということで、直前になって、方言で比較してみようと閃いた。いろいろ調べると興味深い結果だった。ぎりぎり間に合って良かった。

DeepLのユーザとしての発表

AIの利用者としての発表か、AIの開発者としての発表かを選択する。自分は前者とした。ただ、何をテーマにするかが難しい。いろいろと悩んだけど、最終的にDeepLにすることにした。今回の25名の学生のうちDeepLを選択したのは自分ともう一人だった。しかし、学生によって切り口が異なるため、興味深いと思った。ちなみに自分は、方言を切り口に分析し、もう1名の学生は同音異義語を切り口にした。いずれも自動翻訳にとっては悩ましいところだと思う。

DeepLの利用者数は倍々ゲームで急増中

DeepLは、ドイツ生まれのサービスであり、2017年8月28日にサービスを開始した。そして、日本語が対応可能となったのは、2020年3月19日で、中国語と同時に追加された。月間アクセス数は順調に拡大し、2021年5月には約1億7,500万回を記録した。しかし、Google翻訳は月間7.8億回であり、アクセス回数ではGoogle翻訳に軍配があがる。ただ、この調子で倍増すれば、2022年には3億人、2023年には6億人の見込みであり、2024年には10億人を超えるのではないか。その時点でのGoogle翻訳との優劣が気になる。

(出典:DeepL)

他の翻訳ソフトとの比較

DeepLは、Lingueeから誕生した。Lingueeは、言語ペアのオンライン辞書を提供する語彙集(concordance)だ。10億件以上の翻訳データベースに加え、ウェブ上で類似のスニペットを検索して翻訳の根拠としている。専門分野に強いのが特徴だ。アイスランドにある世界23番目の性能(最大性能毎秒5.1ペタフロップス)を持つスーパーコンピュータを活用し、アイスランドの水力発電で運用されている。DeepLでは独自のニューラルネットワークを数学的・方法論的に改善。ネット上の翻訳を検索して品質評価するボット(クローラ)を開発して活用している。DeepLでは 分野毎の専門用語を学習し、独自の用語集を追加可能であり、これは便利だ。これらの結果、翻訳の精度が高まり、下に示すように他の翻訳ソフトに比べても自然な翻訳が可能となった。

(出典:DSL.1sk

方言の翻訳

関西弁などの方言にも対応していると書かれていた。本当か?と調べて見ることにした。ただ、関西弁だけでは面白くないので、京都弁と博多弁と沖縄弁に3つについて調べた。Google翻訳を選んだ学生もいた。発表ではDeepLの判定に留めたが、Google翻訳とその判定結果も追加した。やはりDeepLの方がGoogle翻訳より優秀だ。

京都弁

DeepLでは、10の京都弁のうち50%はOKだった。特に、ほっこりを「仕事を終えた安堵感と達成感」などと訳するのは素晴らしい。Google翻訳も同じくほっこりをunwind(くつろぐ)と訳すなど頑張ったけど、OKなのはこれのみだった。

博多弁

博多弁を話す女性はなかなか魅力的に見える。なんしょーと?すいとーよ。などと言われると恋に落ちてしまいそうだ(笑)。そんな博多弁に対してDeepLは4割がOKだった。Googleも3割がOKと奮闘したが、軍配はDeepLだった。

沖縄弁

沖縄には3年間家族で赴任した。今でも楽しい思い出だ。沖縄の人の訛りはなかなか抜けないけど、意外と東北弁に近いとも聞く。興味深い。そんな沖縄弁を10個ほどピックアップして翻訳してみた。DeepLではOKはなかったけど4割は惜しい!だった。一方、Google翻訳もOKはなかったけど、1割が惜しい!だった。

まとめ

DeepLの無料版でも一度に5,000文字の翻訳をしてくれるのは非常に助かる。また、英文を日本語に翻訳するときに、「です。ます。」調と「である。」調が混在することがあるが、日本語と英語の翻訳を何度か往復すると「ですます」調に統一されて読みやすい翻訳になることがある。正確な英語に翻訳したいときは、日本語も短く、明瞭な表現にすることが大事だ。英語に翻訳したい日本語は、英語を意識して書くと誤訳を避けれる。特に、男性・女性の冠詞や、単数・複数などを意識して書くと英語のチェックが楽だ。今回は、京都弁と博多弁と沖縄弁の3つで翻訳にトライした。京都弁が最もましだったけどそれでも正確に翻訳できたのは半分程度だった。博多弁や沖縄弁ではさらに少ない。今後の改善に期待したい。最近は、翻訳ソフトが優秀なので、最初から英文を書くよりも、日本語をDeepLで翻訳させ、Grammarlyで添削しながら気になる英語や日本語を修正する方法は効率的だと思う。

以上

参考:ブログ紹介
第一回:初回受講
第二回:深層学習時代
第三回:AI実践
第四回:AI+農業
第五回:AIと医療
第六回:AIとアニメ制作
第七回:前半6回のレビューとAI利用
第八回:AIと人文学 
第九回:AIと社会
第十回:AIとゲーム

最後まで読んでいただきありがとうございました。

ITプロ人材のマッチングプラットフォームなら Bizlink をクリックしてみてください。
最新情報をチェックしよう!