Si usa per RNN, ma rispetto al backpropagation through time…
Non è un algoritmo locale, cioè si deve valutare complessivamente l'uscita, non solo gli effetti sulle connessioni sinaptiche