音声翻訳アプリ『VoiceTra』がGoogle翻訳なみに使えるようになっていた

翻訳サービス, スマホアプリ

ほんの数日前、ひょんなきっかけで音声翻訳アプリ『VoiceTra』を使ったところ、翻訳精度がものすごく高く驚かされました。

翻訳された結果が『自然な言葉』になっているため、短い会話を2、3翻訳しただけで「なんか普通の翻訳と違う」と感じるくらい。

翻訳ソフトをいくつか使った経験がある人なら、「なんか凄い」ことが分かるレベルです。

『VoiceTra』は情報通信研究機構が開発・提供している、31の言語に対応したスマホ用音声翻訳アプリです。

音声認識で声からの入力をテキスト化。それを翻訳して合成音声で再生してくれるため、会話の相手と面と向かった状態で使うことができます。

もちろんテキストを直接入力も可能で、音声入力で表示されたテキストを修正してから音声を再生することもできます。

StoreGoogle Play で入手

StoreApp Sotre で入手

この『VoiceTra』、1年ほど前に使った時は「使い勝手はいいものの、翻訳精度はそれほど高いわけでもない」普通の音声翻訳アプリというものでした。

そんなわけでインストールしてることも忘れていたのですが、つい4日前に日本語が話せない人を相手に何の気なしに使ってみたところ、普通に通じていました。

話をした相手はブラジル語(ポルトガル語)だったので、の翻訳精度は自分では分かりませんでした。

ただ、音声認識からして品質が高いことは分かったので、ある程度翻訳の良し悪しが判別できる英語で試してみました。

『VoiceTra』は日常で使えるレベル

日本語⇒英語翻訳で検証してみたところ、VoiceTraは入力側の音声認識と翻訳、どちらも優秀。

精度が高いばかりでなく、音声入力・翻訳の応答速度も早いので、ストレスなく使うことができます。

VoiceTraは音声認識精度が高い

『VoiceTra』は会話に使うことを前提とした音声入力用の翻訳アプリです。翻訳アプリを会話の道具として使うなら、音声入力の認識精度がよくないと実用に耐えないのは言わずもがな。

VoiceTraはその音声認識精度がとても高いんです。どもったり声の抑揚を変えても認識してくれます。

もちろんすべてを正しく認識することはできませんが、それなりの日本語として補正されるので修正も簡単。「会話」の妨げになりません。

翻訳精度が高い

翻訳精度は用途次第で変わってくるので実際使ってみるのが早いです。

VoiceTra では、入力した日本語の下に翻訳した結果が表示されます。さらにその下に、翻訳結果を日本語に再翻訳した文面も表示されます。

再翻訳が表示されるおかげで、意味が通った訳なのかの判断ができる仕組みになっています。入力した音声の翻訳精度が高いだけでなく、その翻訳結果を再翻訳した確認用の日本語も自然な日本語になっています。

音声認識で多少取りこぼしがあってもきちんと翻訳されます。

誤認識を気にするよりも、目的語を省略しないよう意識する方が精度は上がるようです。

精度が上がったのはニューラル機械翻訳(NMT)のたまもの

少しさわっただけでもわかるほどVoiceTraの翻訳精度が向上した理由はというと。

ディープラーニングによるものでした。

VoiceTraが深層学習を取り入れて精度を改善したというプレスリリースが開発元の情報通信機構のサイトにありました。

NICTの先進的音声翻訳研究開発推進センターは、ニューラルネットワーク(深層学習)を用いた機械翻訳の実用技術を開発しました。
ニューラル機械翻訳(NMT)技術を用いることにより、従来の統計翻訳(SMT)技術に比べ、精度が大幅に向上しました。本日から、NICTが開発し、公開している音声翻訳アプリVoiceTra(ボイストラ)に同技術が組み込まれており、精度改善を直接ご体験いただけます。

つまりVoiceTraはGoogle翻訳の翻訳精度の大幅向上と同じく「ニューラルネットワーク(深層学習)」による機械翻訳技術を利用して、飛躍的に翻訳精度が上げたというわけです。

GoogleやVoiceTraのすごさを考えると、翻訳・自然言語処理の分野にはディープラーニングの活用が必須なのかもしれません。

 

情報通信研究機構とは?情報通信研究機構は、NICT・情報通信研究機構は、情報通信技術(ICT)の研究開発や事業支援などを行っている国立研究開発法人です。管轄は総務省。

研究開発法人と聞くと縁遠い存在に感じますが、意外と身近なところにも関わっていて、日本標準時はNICTの原子時計が基準となっています。

VoiceTraは神戸にあるNICTの先進的音声翻訳研究開発推進センターで開発されています。

NICTでは脳情報通信技術と位置づけて脳内ネットワークの研究も行っているなど、一般的にイメージする情報通信よりも広範な研究を行っています。

VoiceTraの使いかた

VoiceTraは口語の翻訳専門アプリだけに、使い方は簡単です。

アプリを立ち上げ自分の言語を選択してマイクボタンを押すと、音声入力モードになります。終了させたい時は再度マイクボタンを押すだけ。

すると文章が表示され、翻訳された言語で音声再生されます。

初期設定では、音声入力モードは自動で終了し、音声再生が行われます。どちらもオプションで設定することができます。

VoiceTra

入力後のテキストは自分で編集することができます。

取りこぼしや誤認識があったら手動で修正します。変更したものはすぐに翻訳文に反映されます。

voicetra

中段のスピーカーボタンを押すと相手の言語での音声再生が行われます。

VoiceTraは会話の翻訳に特化したアプリなので、はじめてでもあまり迷うことはないでしょう。

設定項目

設定は右上のメニューより行います。

メニューにある歯車アイコンをタップすると設定画面に遷移し、合成音声の再生設定や翻訳言語の選択ができます。

初期設定だと翻訳結果が自動で音声出力されるので、自動再生が不要なら「翻訳時に再生」をOFFにします。

音声入力の終了を手動で行いたいなら「自動的に音声入力を終了」をOFFにします。

メニューには「実験に参加する」という項目がありますが、登録している人用なので、普通に使う分には関係ないようです。

VoiceTra利用上の注意

翻訳精度が高く非常に使いやすいVoiceTraですが、日常で使うには気を付けないといけないことがあります。

それは翻訳のために入力された情報が第三者(機関)に頒布されること。

VoiceTraは研究目的で開発されているため、集められたデータは他の組織への提供が前提となっています。

外部に提供されるデータには「誰がいつ使用した」といった個人情報は含まれませんが、翻訳に使った言葉は個人情報には含まれないため秘匿されません。

そのため、個人情報や秘密にしたいことをVoiceTraの翻訳にかけるのは避けるべきです。

NICTは、利用者データを音声・翻訳技術の改良の目的のために様々な形で利用しますので、“VoiceTra”に個人情報やプライバシーを含む情報、営業秘密等、第三者に対し秘密にしておく必要がある情報は入力しないでください。

利用規約 – Androidより

リアルタイムの会話の翻訳ならVoiceTraで必要十分

ふだん外国のサイトを見る時はGoogle翻訳を利用していて重宝しているのですが、これは音声入力に対応していません。

Google翻訳アプリ版なら音声入力ができるにはできますが、認識精度が悪いです。Google検索に使っている音声認識エンジンは優秀なんですが、アプリは別のようなんですね。

voicetra

左(上)がVoiceTra、右(下)がGoogle 翻訳

そのためGoogle翻訳自体は優秀でも、会話には使うのはちょっとむずかしい。

 

日常会話レベルの翻訳ならVoiceTraはニューラル機械翻訳(NMT)を適用しているGoogle翻訳と同じレベルと言っていいです。

おまけにVoiceTraは音声認識と翻訳の反応も速いので、会話を妨げることもありません。

難点は翻訳にかけた語は個人情報に含まれないため、プライベートな情報を翻訳するわけにはいかないということ。この欠点はどうしようもないですが、日常的なコミュニケーションのやりとりに使うには支障はないはず。

観光地での案内や、お店に来た外国人のお客さんとのやり取りにも十分使えますね。海外旅行に出かける時や観光客の対応ばかりでなく、歩いていて道順を聞かれた時にも使えます。

英語が苦手なのに、なぜかよく道を尋ねられるという人は、VoiceTraを入れておくと安心できますよ。