StackLLaMa
https://gyazo.com/46fa26c7296bf48ef706778ce5e7b612
GitHub : https://github.com/lvwerra/trl/tree/main/examples/stack_llama/scripts
Demo : https://huggingface.co/spaces/trl-lib/stack-llama
Stack Exchangeから収集した質問と回答のペアを使用して、LLaMAをファインチューニング
blog : https://huggingface.co/blog/stackllamaStackLLaMA:RLHFでLLaMAを鍛えるハンズオンガイド