このように、3倍速前後までの高速再生の聴き取りやすさは向上しましたが、わたしたちは、さらなる高速再生方法や、合成音に対する適用も検討しています。その際には、すべての情報を漏らさず伝えるのではなく、情報の多くをそぎ落とし、スピードを重視しました。
この技術は音声データの他にテキストデータが必要です。というのも、音声の韻律情報が使えない合成音から文中の重要部分を推測するには、我々が研究してきたものの他に、品詞や文構造などを解析しそれらを元に話速を変換する必要があるからです。実装を目指す「DAISY」でも、今後は音声合成によって再生するものが増えていくとの事でした。
高速再生の方法としては、主に次の方法を採用しています。
もともとテキストデータがあるものについて、文章構造と品詞の解析をしながら、音声合成をします。句読点の位置を基準にして、文章の内容理解に重要と思われる品詞の再生速度は遅めにし、それ以外の品詞はかなり高速で再生する手法です。
「インデキシング法」は、文構造の解析を行い、句点の直後、句点の直前のみの再生速度を落とし、そのほかの個所は超高速で再生するというものです。オブリーク法よりもさらに多くの情報をそぎ落として高速再生します。
6倍速程度の超高速で聞かせるためには、重要と思われる個所の情報のみを残しそのほかの個所は捨てなければ、単語単位での聴き取りすらも困難です。また8倍速で聞かせるために残る情報は文頭と文末の情報のみです。このように、内容をバサバサと切り落として再生していきます。
複数の高速再生方法を分析した資料