OrCam MyEyeの機能は、どのようなテクノロジーによって実現されたのでしょうか。
柳平:画像解析技術とAIです。OrCam MyEyeは100円ライターほどのサイズで重さも22.5gととても軽量です。この小型デバイスに文字や画像を解析できるカメラと、言語を理解して音声に変換するAI、スピーカーを搭載できるようになったこと自体がテクノロジーの進化によってもたらされてものであり、革新的なポイントだと思います。ちなみに現在、OrCam MyEyeの他にも文字を音声に変換するデバイスはありますが、端末にAIが搭載されているわけではないので、機能を活用するためにはインターネット接続が必要になります。一方で、OrCam MyEyeは必要な機能が一台に集約されているので、インターネットを必要としません。そのため、インターネット接続を要するデバイスに比べて、音声変換のスピードが速いです。
インターネットの接続を必要とするときはありますか?
柳平:ソフトウエアのアップデートは定期的に行っており、その際には、インターネットに繋いでアップデートを実施していただきます。ウェブサイトに新しい QR コードが発行されるので、それをOrCam MyEyeのカメラに写すことによって、ソフトウエアのダウンロードがはじまる仕組みです。
具体的に、どのようなことがアップデートされるのでしょうか?
柳平:基本的には読み間違いの修正、顔の認識機能の精度向上などです。OrCam MyEyeは34言語に対応していますが、日本版の機能を向上させるためには、日本語や日本人の顔のデータを膨大に収集する必要があります。年に2回のアップデートのタイミングで精度を上げられるように、時間を掛けてデータを収集しています。
日本版の機能面を充実させるうえで難しかったところはありますか?
柳平:日本語はカタカナ、ひらがな、漢字など多様なので、データの蓄積に時間が掛かりました。また、漢字は読み方が音読みと訓読みがあるため、AIにパターンを学習させる手間と時間が掛かりました。
指をかざした周辺にあるテキストを認識し、音声で読み上げてくれる