entropix
目標は、エントロピーを使用してコンテキスト認識サンプリングを行うことです。これにより、o1のCoTやAnthropicsに似たものをシミュレートして、推論時間計算を使用してはるかに優れた結果を得ることができるはずです。 オリジナルの実装より少し古い(attention head entropyを考慮しない)らしい(GGUFで出来るかもわかんないとのこと)
DeepSeek-R1蒸留モデル版のQwen2.5とかでこれやったらどの程度性能が上がるんだろmorisoba65536.icon 関連しているらしい
AIモデルには本来、複雑な問題を解決するための推論能力が備わっているが、greedy decodingに頼ると途中の思考過程を省略して直接答えを出そうとする傾向があり、ハルシネーションを引き起こす可能性がある