「高速音声再生技術」とは、短時間で効率よく情報を得られるようにするためのシステムです。現在、電子書籍などをはじめとして、多くの場面で音声を高速再生する技術が活躍し、耳から情報を取得する視覚障がい者の方たちにも良く利用されています。ですが、実際に3倍速などで聞いてみると、すべての人にとって聴きやすいものではなく、高速になるほど意味を理解するのが困難になるのが現状です。意味の取りにくい音声を聞くのは苦痛なものです。そこでわたしたちは、高速再生をしても聞き取りやすい技術の開発に取り組んできました。
もともとNHK放送技術研究所で、「テレビの内容をもっとゆっくりと聞くことはできないか」という視点から開発された技術がベースとしてありました。重要な個所では音声がゆっくりになるよう変換しつつ、音声データに含まれる「間」を削ることで時間遅れを生じずにテレビ放送を聴き取りやすくするシステムとして実用化しました。
高速再生はその技術の応用で、逆に早くても聞き取りやすい音声にする技術です。聞き取りやすい高速音声再生技術があれば、視覚障がい者の方たちにも役に立ちます。
晴眼者の場合は、本などを読むときには、「斜め読み」といわれる読み方をすることができます。要点だけをかいつまんでざっと目を通すことで、短時間で情報を得る方法ですが、多くの視覚障がい者の方々は主な情報取得の手段が音声であり、それが不可能です。内容を理解するためには最初から最後まで話を聞かなければなりません。そのため、朗読により読み上げられた録音図書の文庫本1冊を最初から最後まで読むのに、1ヵ月ほどかかってしまうこともあるそうです。
高速音声再生技術の質が上がり聞き取りやすくなれば、晴眼者の「斜め読み」のように「斜め聴き」ができるようになるはずです。そうすれば、短時間でより多くの情報を得ることができるようになります。
そこで、ご自身も視覚障がいをお持ちで、かねてより「斜め聴き」を研究している、鳥原信一(慶應義塾大学S.F.C研究所の訪問研究員)さんにご協力いただき、聴き取りやすい高速音声の研究を進めてきました。