2022.10.01 重要発言検出モデルについて国際会議で発表
4名でのグループディスカッション場面における,3種類の情報(テキスト、オーディオ、ビデオ)を入力データとし,履歴情報を持つTransformerにより,重要な発話を推定するモデルを作成し,高い性能(F-measure 0.809)を達成しました.
Nihei, F., Ishii, R., Nakano, Y., Nishida, K., Masumura, R., Fukayama, A., Nakamura, T. (2022) Dialogue Acts Aided Important Utterance Detection Based on Multiparty and Multimodal Information. Proc. Interspeech 2022, 1086-1090, doi: 10.21437/Interspeech.2022-324