2022.08.23
特別企画 [PR] Web Designing 2022年10月号
コミュニケーションを加速させる機械翻訳、潜むリスクと対応策 情報過多時代の企業におけるコミュニケーションの理想と現実
機械翻訳の成長が著しい近年、母国語が違う者同士のコミュニケーションは、元情報さえあればすぐにそれぞれの母国語に翻訳でき、よりスムーズになってきました。しかし、機械翻訳はまだまだ発展途上であり、コミュニケーションに活用していく上では幾つかの点に注意を払う必要があります。
【CONVERSATION 1】機械翻訳の現在と課題
機械翻訳の歴史は意外と古く、1950年代には既に研究が始まっています。もともとはマニュアルなどの技術文書の翻訳に用いられるのが主でしたが、近年では情報発信者の言葉をリアルタイムに翻訳してコミュニケーションに活用する需要が高まっており、多くの企業がこの領域における導入研究を進めています。
リアルタイムに発信される言葉は必ずしも定型のものではありません。同じ単語でも文脈に合わせて意味が変わったり、辞書には載っていない流行語やネットスラングが用いられ、これらをどのように扱うかは機械翻訳における重要な課題です。ある程度コントロールが利く環境下であれば比較的対応は容易ですし、ベテラン翻訳家の対応を教師データとして機械翻訳を進化させる方法もあります。50年以上も機械翻訳の研究開発を行っているシストランジャパンではどのように対応しているのでしょうか。同社代表の江上聡氏が教えてくれました。
「例えば『イーグル』というゴルフ用語がありますが、これは直訳すると『鷲』になりますので、ゴルフに関する話題では意味が通じなくなります。また、最近日本の若者の間では、対象を称賛する『○○しか勝たん』や、笑えることを意味する『草』といったようなネットスラングが使われることがありますが、当社の場合、こうした言葉を予め辞書に登録すれば文脈に応じて適切な翻訳ができるようにしています」
機械翻訳は繰り返し学習することで、翻訳精度を向上できます。「いい経験をさせれば優秀になっていく点は人間と一緒」だと、江上氏は話しました。
【CONVERSATION 2】把握しておくべき「機械翻訳に潜むセキュリティリスク」
イレギュラーな言葉や文脈への対応は機械翻訳にとっての課題ですが、ユーザー側にも注意しなければならない点があります。セキュリティ面です。例えばGoogleは、同社のサービスを利用したユーザーのデータを収集・使用していることを明言していますが、Google翻訳で翻訳した情報も同社が収集していることになります。他のオンラインで利用できる機械翻訳の多くもGoogle同様、入力した情報を収集していると考えられますが、これは「データセキュリティ的に問題がある」と江上氏は指摘します。
「オンラインの翻訳ツールで怖いのは、サービス提供会社から外部にデータ漏えいが起こることであり、過去には実際にそうしたケースは起こっています」
シストランジャパンのソリューションの場合、第三者機関を介さずに社内ネットワーク上に翻訳専用のサーバを構築するオンプレミス型であるため、情報漏えいのリスクはないと言います。では、オンラインで利用できる機械翻訳は使用しない方がいいのかと言うと、必ずしもそうではありません。情報システムエンジニアリングの代表取締役社長・黒田聡氏は、使い分けを意識すべきとします。
「例えばネット上で既に公開されているコンテンツを翻訳する際などは、Google翻訳に代表されるようなオンラインツールを活用しても問題はないでしょう。しかし、自社製品の開発情報や個人情報を含む情報、法務関係の情報といった社外秘の機密情報を翻訳する際には、オンプレミス型の翻訳ツールを使うべきだと言えるでしょう」
機械翻訳の進化で簡単に外国語を翻訳できるようになり、世界はどんどん身近になっていきます。だからこそ、セキュリティリスクを考慮し、しっかりとしたコンプライアンス意識を持ってサービスを活用していくことが、情報過多時代を生きていく上での鍵となるのです。
※worktransform®は株式会社情報システムエンジニアリングの登録商標です。
企画協力:株式会社情報システムエンジニアリング
令和2年度第3次補正 事業再構築補助金により作成