
言語や五感情報を統合できる脳情報空間モデルの作成技術

特徴・優位性
- 視覚、聴覚、触覚、嗅覚、味覚、言語の6種類のモダリティデータを脳の情報空間で統合したうえでパターン認識を行うマルチモーダルAI
- 脳の洗練されたマルチモーダル統合をAIに利用することで、人間の判断や行動の推定をはじめ様々なパターン認識問題で効力を発揮
用途・応用分野
- マルチモーダル情報に対する人間の認知や行動に基づくマーケティングやサービスに応用
- マルチモーダル好感度推定(例:新しいお店を開くのに好感度の高い内装・BGM・香りの組み合わせを知りたい)
- マルチモーダル商品推薦(例:ある音楽をネット購入した人に対して食品や書籍をレコメンデーションしたい)
- マルチモーダル購買意欲推定
- マルチモーダルキーワード検索

概要
言語や五感(視覚、聴覚、触覚、嗅覚、味覚)などの異なる感覚種・データ種を組み合わせて扱う情報処理をマルチモーダル情報処理と呼びます。人間の脳が日常的に行っているマルチモーダル情報処理ですが、現在の人工知能はそのような処理が得意ではありません。
本技術は、人間から計測した脳応答を基に、マルチモーダル情報の効果的な統合を可能にするデータ空間(脳応答空間)を構築します。また同時に、任意のマルチモーダル情報から構築済みの脳応答空間へ情報を変換するモデル(脳応答予測モデル)も構築します。
計測した脳応答はこれらの構築時のみ必要であり、構築後は任意のマルチモーダル情報を統合するシステムとして機能します。本技術によって統合されたマルチモーダル情報は様々なパターン認識に利用でき、特に人間の認知や行動の推定において高い有効性を発揮することが期待できます。
現在、本技術は基礎実証を進めている段階であり、今後は試作や実証実験など基礎的な部分からの長期的な開発・検証が必要です。外部連携を図る場合も、長期的な連携関係を築きつつ、研究員や技術者などの研究遂行に必要な人的リソースを提供してもらえることが、重要な要件となります。(2025年6月19日更新)



言語や五感情報を統合できる脳情報空間モデルの作成技術
関連情報
- 特開: 2024-019892
担当部門
未来ICT研究所 脳情報通信融合研究センター(CiNet) 脳情報工学研究室
未来ICT研究所 脳情報通信融合研究センター(CiNet) 脳情報工学研究室(https://cinet.jp/japanese/)