User Tools

Site Tools


neurali:ipotesi_architettura_action-critic

< funzioni_del_cervello_artificiale

< modello actor-critic

Come si può implementare il modello actor-critic sul problema di rilevare ostacoli ed evitarli?

Teoria

Ipotesi

Husky:

  1. propriocezione
  2. laser
  3. comando ricevuto

La valutazione dello stato attuale riceve 1 e 2 (7 stati di propriocezione + 360° di posizione dell'ostacolo)

Action riceve in input lo stato attuale e invia i comandi ad husky (3)

Action riceve anche la dopamina da parte di Critic

Critic riceve in input lo stato attuale e il comando inviato che torna indietro

Critic deve solo fare la differenza dei due ingressi e fornire dopamina quando sono uguali. Perchè quando sono uguali significa che mi muovo evitando gli ostacoli…

NOTA: per rilevare ostacoli con memoria della mappa dove mi muovo, devo aggiungere una memoria, cioè una memoria storica degli stati che vengono attraversati, ad esempio, aggiungendo connessioni ricorrenti RNN

neurali/ipotesi_architettura_action-critic.txt · Last modified: 2020/06/08 22:20 by 127.0.0.1