質の高い音声入力
モードを増やすことで加工を可能にするアイデア
---
ささやきにより改行など特殊文字モードにする
ニューラルが必要らしいsta.icon
これらを実現するために、ささやき声と通常の声を区別するためのニューラルネットワークと、ささやき声を認識するためのニューラルネットワークの2種類を開発した。
口パクも使えば3モード
今回は「ささやき声」と「通常の声」の2つを組み合わせた方法を採用したが、これらに加えて「無声発話(口パク)」を導入した3つの組み合わせも考えられる。
sta.icon
あれだな、まず一人ひとりがチュートリアルして「その人にあった塩梅」を設定する感じになるのかな?sta.icon