現在、音声認識の性能の良さを評価していただいていますが、課題も少なくありません。たとえば、先天的な聴覚障がいがあって、手話を利用している人は、手話が母国語のような意味を持ちます。そうした方の使用する手話(日本手話)の文法は、日本語の文法とは大きく異なるので、感覚として、日本語は外国語のようなものだと思います。そういった日本語を得意としない人へのフォローが、今後の課題のひとつです。
また、音声認識機能は登録していない単語を認識することはできません。固有名詞など登録されていない言葉を受けると、音声認識は無理に登録された単語に置き換えて埋めようとします。そのため、文意が分からないものになったりしてしまいます。「こえとら」の場合、固有名詞は現在80万語くらい登録していますが、まだまだ足りていないというのが現状です。そこで、「こえとら」の拡張として、単語を登録する「辞書登録機能」を考えています。
利用環境は、現在、通信を使って、サーバーを通して音声認識を行い、再び手元のiPhoneに戻すという流れになっています。この方式では、通信環境が悪いと利用できないので、iPhoneの端末だけで音声認識と音声合成を行えるものを、平成26年2月を目標に開発中です。登録語は8万語程度と少なくなるかわりに、災害時など通信環境がマヒした状態でも、意思疎通の手助けができるツールとして使用できるものにしたいと思っています。
聴覚障がい者向けだけではなく、健聴者をサポートするアプリとして、「こえとらVoiceCanvas」というアプリも開発中です。耳の遠くなった高齢者の方などの応対の際に使ってもらえるよう、窓口などに設置できたらと考えています。より実用的なアプリにするため、音声認識の間違いをすぐに修正できる機能や音声認識のできない言葉はその場でキーボード入力ができるようなしくみを構築しています。あらゆる場面を想定しながら開発に取り組んでいます。
将来的には、音声認識の基礎技術をライセンスにし、企業に販売することを想定しています。音声認識の技術を社会の中で活用してもらうことが、日本の基礎体力増強につながると思います。
合成音声も、自然な発声ができるようになってきていますし、これから先、音声認識の認知性も上がってくるはずです。最終的には、「こえとら」シリーズが、利用者の「耳」の代わり、「声」の代わりになって、コミュニケーションに欠かせないアプリにしていきたいと考えています。