マルチモーダル
テキスト、画像、音声、動画、センサー情報など、複数の異なる種類のデータを統合して処理する技術やシステム