DeepScaleR

https://gyazo.com/9392eb7fc8264a7c4057fc24074a9411

蒸留+ GRPOで数学力だけなら1.5BがOpenAI o1-preview超えたのか…morisoba65536.icon

ただ、Xでの報告見る限りほんとに数学特化(数学以外何もできない)のようだ(サイズ考えると致し方ないところはあるが)morisoba65536.icon