Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
neurali:modello_actor-critic [2017/06/25 15:11] profpro [Actor-critic model] |
neurali:modello_actor-critic [2018/04/25 07:55] (current) |
||
---|---|---|---|
Line 16: | Line 16: | ||
L';;;;agente;;;; svolge due lavori eseguendo due ruoli con due reti diverse: | L';;;;agente;;;; svolge due lavori eseguendo due ruoli con due reti diverse: | ||
- | - La rete *Actor* è quella che seleziona l'azione da prendere in un certo ''stato'' | + | - La rete *Actor* è quella che stabiisce l'azione da eseguire in un certo ''stato'' |
- La rete *Critic* è quella che valuta le conseguenze di tale azione, modificando V(s) del passo temporale <del>precedente</del> successivo. | - La rete *Critic* è quella che valuta le conseguenze di tale azione, modificando V(s) del passo temporale <del>precedente</del> successivo. | ||