Expanding
短いテキストから長いテキストを生成(だから「拡張」)
レビューを元に返信を生成する例
ポジティブまたはニュートラルならお礼
ネガティブなら謝罪
temperatureについて
My favorite food is
pizza 53%
sushi 30%
tacos 5%
temperature 0では確率最大のpizzaしか出ない
temperature 0.3より0.7の方が(確率最小の)tacosが出やすい
temperatureの値が大きいとLLMの出力はよりランダムになる
ヘルパー関数、temperatureを渡せるようにしている!(デフォルト値は0)
temperatureの指針
信頼性や予測可能性が要求されるタスク(for tasks that require reliability, predictability)ではtemperatureは0にする
variety(変化に富むこと。creative)が要求されるtasksでtemperatureを0より上げる