わかりやすい説明ありがとうございます。素朴な疑問なのですが、Transformerを含めた機械学習モデルは具体的にどのようにデータを学習して、正解のデータを出力する精度をあげているのでしょうか。私達利用者は任意のデータを入力し、比較的高速に望ましい出力を得られていますが、この精度や速度に至るまでに学習というフェーズを経たと思います。こちらもわかりやすく説明してほしいです。