Google 翻訳の功罪2023/01/20(金)
Google 翻訳などの機械翻訳エンジンは、外国語で書かれた情報にアクセスするために、とても頼りになるツールです。例えば化学分野では、ドイツ語の文献がときどき必要になります。最近の重要な文献はほぼ英語ですが、1980年代ぐらいまではドイツ語の論文も普通にありました。私はドイツ語はまあ読めないこともないのですが、とにかく単語を忘れてしまっているため、まともに読もうとすると、辞書を引くだけで大変な時間がかかります。そこで、機械翻訳に頼ることになります。
最近、実際に出会った論文の一部です。
H. Tröster, Dyes and Pigments, 1983, 4, 171-177.
実験項なので、まあなんとなくはわかるのですが、「なんとなく」ではいけません。機械翻訳してみましょう。元の論文の PDF から文章をコピーして、Google 翻訳に貼り付けてみます。
やや不自然な日本語だけど、一応意味はわかります。よく見ると、元の論文の PDF に誤字があることがわかります。3行目の "Ammoniakliisung" は "Ammoniaklösung"だし、2-stündige のウムラウトも抜けています。これは、出版元が紙媒体から PDF 化したときに起きたエラーなので、手動で訂正するしかありません。概して、ウムラウトを含む文字は正しく認識できないことが多いようです。しかし、Google 翻訳はこれらのエラーを認識して、正しく「アンモニア溶液」「2時間」と翻訳しています。ありがちなエラーなので、想定済みなのでしょうね。
さて、このように頼りになる Google 翻訳ですが、頼りっぱなしではいけません。私は、英語には機械翻訳は使いませんし、ドイツ語・フランス語ぐらいまでは、機械が出した「翻訳」と原文を照らし合わせる作業はなるべくやります(フランス語はごく初級しか知らないので辛いですが)。機械の助けを借りつつも、なるべく自力で読める力は残しておきたい。これは、できるだけオリジナルの情報にアクセスして、主体的に物事を考えるために、絶対に必要なことです。
特に、英語は自力で読めるようにならないといけませんね。本学の学生には、英語の論文を読む時に、機械翻訳でまず「全訳」を作成して、その日本語「だけ」を読む人がたくさんいます。これは絶対にダメです。原文を直接読めるようになっていかないといけない。辛いのはわかりますよ(私もフランス語やロシア語を読む時には同じ辛さを味わいます)。でも、英語は読めるようにならないといけない。理由は、前回の記事「ネット検索をうまく使うには」の最後で述べたとおりです。英語の情報は圧倒的に量が多いからです。
前回の記事では、「機械翻訳でもなんでも使って」と書きました。そうはいっても、「原文を直接読まない」人は、そもそも情報にアクセスできないのです。なぜかと言うと、英語で適切なキーワードを思いつくことができないからです。大学の有機化学を学んだ人に質問です。例えば、「アルケンの臭素化の立体選択性」について英語で解説しているページを検索で見つけられますか? "bromination of alkenes stereoselectivity" というキーワードを自力で思いつけますか? そういうことなんですよ。
もともと持っている情報量が少ない人は、そこから検索で情報を広げていくことができないのです。まずは、もとの情報量を増やさないといけない。それには、やっぱり多くの文章を読むことです。動画ではダメです。情報の密度がぜんぜん足りません。それこそ「タイパ」が低すぎます。同じ時間をかけるのなら、文章を読むことを選ぶべきです。また、日本語の文章だけでなく、英語の文章も読まないといけない。自分が持つ「英語の情報量」を増やすためです。そうしないと、これからの不確実性の時代で生き残ることはできないのです。