初期の神経系を持つ動物における貢献度分配問題 - 183Lab

初期の神経系を持つ動物における貢献度分配問題

以下の４つを組み合わせることで貢献度分配問題(Credit assignment problem)を解決する

eligibility trace

隠蔽 (overshadowing; OV)

阻止(Blocking; BL)

潜在制止(latent inhibition; LI)

Naa_tsure.icon注意したいのがこれは神経レベルではなく、行動と報酬の文脈

Naa_tsure.iconこれは報酬と刺激が近接している場合には有効だが、時間的に離れている時にはうまく働かない

例えば、チェスのような報酬が最後にしか与えられない問題はこの仕組みでは強くならない

temporal credit assignment problem

Stochastic Neural Analog Reinforcement Calculator; SNARC

これを克服するにはTD learningが必要