Speechbox
Speechboxの基本的な考え方は、音声記録を「非正規化」することです。 例えば、「マリーナ・ベイ・サンズに行く」という文章は、文脈によって複数の意味を持つことがあります。適切な句読点がないと、話し手がビーチに行く計画を楽しみにしているのか、ビーチに行くかどうか質問しているのか、それとも現在の方向性について発言しているのかが不明確になります。
どっち?
「マリーナ・ベイ・サンズに行く(!)」
「マリーナ・ベイ・サンズに行く(?)」
Whisperを使って適切な句読点や大文字を追加することで、Speechboxは文の意味をあいまいにし、他のダウンストリームアプリケーションでより有用なものにすることができます。
Speechbox「マリーナ・ベイ・サンズに行く!」
あいまいにするの?nomadoor.icon