macで文字起こし
Audacity などでノーマライズ、ラウドネスノーマライズをしてからやると精度が上がるようだ。 音声ファイルを用意する。
Audacity などでノーマライズ、ラウドネスノーマライズする。録音レベルが低いと精度も低いようだ。 長い音声ファイルは文字起こしに失敗しやすいので、複数に分割する。
Aiko で最初のテキストにする。無音部分や極端に音の小さい部分は、同じ文を繰り返してしまう場合がある。映画「シャイニング」のようだ。 エクスポートは単なるtxt でよい。
分割した音源に対応しているテキストを順番にマージして、単一のテキストにする。
ChatGPT-4 の Code Interpreter に、マージしたテキストを渡し、プロンプトで冗長な部分や不自然な部分を修正するように指示する。
ChatGPTが作った修正ファイルをダウンロードしてチェックする。ChatGPTは修正ファイルを持ったままなので、プロンプトで修正の指示をするだけで良い。
これを繰り返す。