entropix

エントロピーベースのサンプリングと並列CoTデコード(Parallel CoT Decoding)

目標は、エントロピーを使用してコンテキスト認識サンプリングを行うことです。これにより、o1のCoTやAnthropicsに似たものをシミュレートして、推論時間計算を使用してはるかに優れた結果を得ることができるはずです。

https://note.com/shi3zblog/n/n3a8944695680?sub_rt=share_pb物理学者の逆襲!?Entropixはわずか3億6000万パラメータで1000億パラメータ級の回答を引き出す!Claude-3でも間違う問題を360Mが正しく解く

オリジナルの実装より少し古い(attention head entropyを考慮しない)らしい(GGUFで出来るかもわかんないとのこと)

DeepSeek-R1蒸留モデル版のQwen2.5とかでこれやったらどの程度性能が上がるんだろmorisoba65536.icon