neurali:ricompensa_globale
Differences
This shows you the differences between two versions of the page.
Previous revisionLast revision | |||
— | neurali:ricompensa_globale [2020/06/08 22:20] – external edit 127.0.0.1 | ||
---|---|---|---|
Line 1: | Line 1: | ||
+ | ====Ricompensa Globale oppure Locale==== | ||
+ | Reinforcement learning in populations of spiking neurons, di Robert Urbanczik, Walter Senn (2008) | ||
+ | |||
+ | Nella teoria del Reinforcement Learning (LD) si applica una plasticità sinaptica modulata dalla ricompensa. | ||
+ | |||
+ | C'è il problema che la ricompensa arriva solo alla fine, non negli stati intermedi | ||
+ | |||
+ | C'è anche il problema che la ricompensa è globale, cioè non è indirizzata ai singoli neuroni. Con la ricompensa localizzata al singolo neurone si ottiene un apprendimento più veloce anche con reti molto popolose. | ||
+ | Per indirizzarla a tutti i neuroni ci vorrebbero troppe connessioni. | ||
+ | |||
+ | Nella ricerca citata in alto alla pagina, si dimostra che si può usare anche la ricompensa globale per modulare le plasticità sinaptiche, a patto di aggiungere queste informazioni aggiuntive: | ||
+ | |||
+ | - memoria degli impulsi del singolo neurone, precendeti alla ricompensa | ||
+ | - memoria degli impulsi della popolazione (che significa?) | ||
+ | |||
+ | tempotron è un modello di neurone |
neurali/ricompensa_globale.txt · Last modified: 2023/06/09 10:06 by profpro