entropix
https://github.com/xjdr-alt/entropix
xjdr-alt
/entropix
エントロピーベースの
サンプリング
と並列CoTデコード(
Parallel CoT Decoding
)
目標は、
エントロピー
を使用してコンテキスト認識サンプリングを行うことです。これにより、o1のCoTやAnthropicsに似たものをシミュレートして、推論時間計算を使用してはるかに優れた結果を得ることができるはずです。
https://note.com/shi3zblog/n/n3a8944695680?sub_rt=share_pb
物理学者の逆襲!?Entropixはわずか3億6000万パラメータで1000億パラメータ級の回答を引き出す!Claude-3でも間違う問題を360Mが正しく解く
関連しているらしい
https://arxiv.org/abs/2402.10200
Chain-of-Thought Reasoning Without Prompting
AIモデルには本来、複雑な問題を解決するための推論能力が備わっているが、
greedy decoding
に頼ると途中の思考過程を省略して直接答えを出そうとする傾向があり、ハルシネーションを引き起こす可能性がある
OpenAI o1