< [[neurali:funzioni_del_cervello_artificiale]] < [[neurali:modello actor-critic]] Come si può implementare il modello actor-critic sul problema di [[neurali:rilevare ostacoli ed evitarli]]? Teoria {{neurali:potjans.png?400}} Ipotesi Husky: - propriocezione - laser - comando ricevuto La valutazione dello stato attuale riceve 1 e 2 (7 stati di propriocezione + 360° di posizione dell'ostacolo) Action riceve in input lo stato attuale e invia i comandi ad husky (3) Action riceve anche la dopamina da parte di Critic Critic riceve in input lo stato attuale e il comando inviato che torna indietro Critic deve solo fare la differenza dei due ingressi e fornire dopamina quando sono uguali. Perchè quando sono uguali significa che mi muovo evitando gli ostacoli... NOTA: per rilevare ostacoli con memoria della mappa dove mi muovo, devo aggiungere una memoria, cioè una memoria storica degli stati che vengono attraversati, ad esempio, aggiungendo connessioni ricorrenti RNN