書籍「いちばんやさしいGoogleビジネスプロフィールの教本」

Skypeのリアルタイム翻訳が日本語にも対応!「翻訳コンニャク」が登場!

テクノロジー人工知能

ついにSkypeのリアルタイム翻訳が日本語に対応します。

今までのSkypeのリアルタイム翻訳では、英語・フランス語・ドイツ語・イタリア語・ポルトガル語・スペイン語・ロシア語・中国語(マンダリン)・アラビア語の9言語に対応していましたが、ここに日本語も加わることになります。

まさにドラえもんの世界の「翻訳コンニャク」が登場したことになります。

マイクロソフトは4月7日、スマートフォンアプリ「Microsoft Translator」や「Skype 翻訳(Skype Translator)」などで翻訳機能を提供している「Microsoft Translator」において、リアルタイム会話翻訳の対応言語に日本語を追加したと発表した。

Microsoft Translatorでは、これまで使用していた統計的機械翻訳に代わり、ニューラルネットワークベースの翻訳エンジンを使用。これにより、リアルタイムでの音声翻訳を実現したほか、翻訳自体の精度も大幅に向上しているという。機械翻訳では、人が翻訳した学習データを活用。統計的な単語の並び順によるマッチングは可能だったものの、長い文章などでは全体の関係を処理できなかったという。

リアルタイム会話翻訳は、Microsoft Translatorアプリの「ライブ機能」として実装される。スマートフォンやブラウザ上でも利用でき、1対1の会話だけでなくグループ間の会話にも対応する。今回の日本語対応により、翻訳可能な言語はアラビア語、中国語(マンダリン)、英語、フランス語、ドイツ語、イタリア語、ポルトガル語、スペイン語、ロシア語を含めた10言語になる。

外国語が話せなくても会話可能–マイクロソフトのリアルタイム翻訳が日本語に対応

Skypeのリアルタイム翻訳は、「翻訳コンニャク」だよね?

ほとんどの方がご存じだと思いますが、「翻訳コンニャク」とは、ドラえもんに登場するひみつ道具ですww
見た目はコンニャクで、食べるとどんな言語でも自国語として理解できるというスグレモノ。
マンガの世界の話だと思っていましたが、いよいよ現実的な話になってきましたね。

未来の話ではなく、もう目の前まで来ている話なのです。

Skypeのリアルタイム翻訳の精度は?

今のところ、そこまで翻訳の精度は高くはありません。
まだまだ発展途上なので間違いも多いのですが、中学生レベルの英語力があれば、大まかな意味を把握できます。

リアルタイム翻訳って、人間の翻訳を置き換えるレベルのものではないので、大まかな意味が分かればいいという用途で限定的に使うのが正しい使い方になります。

「正確な意味が必要な翻訳」の場合は、今まで通り人間の翻訳ということになります。でも、自動翻訳ツールの精度はAIでどんどん賢くなるから、近い将来、自動翻訳ツールに置き換わっていくことになると思うけどね。

自動翻訳ツールが理解できるように話しかける

自動翻訳ツールを上手に使うには、自動翻訳ツールが理解できるように話しかけることです。文章を短く切るなどの工夫をすることで、翻訳の精度が上がります。

「Googleアシスタント」や「Siri」で音声検索するときって、音声アシスタントが理解できるように、分かり易い言葉で検索しますよね?

自動翻訳ツールを使う場合も同様で、自動翻訳ツールが理解できるように話しかけることで、そこそこの精度の翻訳が返ってくるのです。

音声アシスタントも自動翻訳ツールも、発展途上なので、人間に話しかけるような言葉では、精度の高い答えが返ってこないということを、頭に入れておくと良いです。

今のテクノロジーでは、なぜか人間が機械に合わせないとダメなんだよねww

Googleの自動翻訳はどうなってるの?

2016年11月、Googleは、Google翻訳にニューラルネットワークを取り入れました。

その結果、Google翻訳の精度は大幅に向上したのです。以前と比べると、機械的な文章はだいぶ減ってきましたからね。

機械学習で精度向上、グーグルがGoogle翻訳の裏側明かす

また、YouTubeの自動字幕起こし機能も、翻訳の精度が確実に上がっています。
YouTubeの字幕のクオリティは、大体の意味を把握するということならば、問題ないレベルですからね。

Googleは17日、YouTubeの字幕付き動画の数が10億本を超えたと発表した。

動画字幕機能は2006年、自動字幕起こし機能は2009年より提供を開始しており、現在、自動字幕付きの動画は10億本に達したという。また、自動字幕付き動画は毎日世界で1500万回以上再生されている。

これはYouTubeの自動字幕起こし機能と、Googleの自動音声認識(ASR)技術を組み合わせて実現したもの。音声認識機能と機械学習アルゴリズムの改善、トレーニングデータの拡大が精度向上のカギとなり、これらの技術を同時に用いることで英語自動字幕の性能は以前より5割程度向上したそうだ。

Googleによると、これは「人の手で文字起こしを行った際にミスが発生する確率に徐々に近づいている」という。今後、対応言語も10言語(日本語、英語、オランダ語、フランス語、ドイツ語、イタリア語、韓国語、ポルトガル語、ロシア語、スペイン語)に拡大し、改良を続けていくとしている。

YouTubeの字幕付き動画の数が10億本を突破

メッセンジャーアプリと自動翻訳の相性は良い

今回Skypeで自動翻訳機能が実装されましたが、自動翻訳機能ってメッセンジャーアプリとの相性がいいんですよね。

Skypeのような音声のリアルタイム翻訳ができるのであれば、テキストの自動翻訳なんて簡単にできますから。

今後、LINE、Facebook Messenger、WhatsApp、ハングアウトなどでも、自動翻訳が実装されていくはず。

スマホのスペックが上がってきているので、LINEのようにPCを使わないサービスでも、自動翻訳機能が実装されていくことになりそうですね。