自分の癖にあったファインチューニング用データセットをLLMで作ろう!【Calm2】
プロンプトが機能する7B以上のモデルを用いてデータセットを作る記事
API機能をsessionからOnにできる
適当にfew-shotさせて自分の好きな物が出るように祈ります。
そこそこtop_pやtop_k,temperatureを上げてしまいます。こうすることで安定性が下がりますが、「50回実行したが出力結果が収束してしまい、データセットとしては使いづらい」ということを防止します。
不完全といえど、良さげなデータがいくつか出力されました。 このデータを使ってfew-shotのプロンプトを修正します。
これを続けることで、今まで全部手動だったデータセット作成がほぼ自動化されました。