neurali:td-learning
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revision | |||
neurali:td-learning [2020/06/08 22:20] – external edit 127.0.0.1 | neurali:td-learning [2023/06/09 10:04] (current) – profpro | ||
---|---|---|---|
Line 11: | Line 11: | ||
* Il tempo decisionale di una rete neurale con TD-learning è confrontabile con il tempo di un algoritmo classico. | * Il tempo decisionale di una rete neurale con TD-learning è confrontabile con il tempo di un algoritmo classico. | ||
- | Iniziamo a parlare della politica di **stima** o predizione del problema, di V funzione | + | Iniziamo a parlare della politica di **stima** o predizione del problema, di una funzione |
===Esempio=== | ===Esempio=== |
neurali/td-learning.1591647605.txt.gz · Last modified: 2020/06/08 22:20 by 127.0.0.1