Le exploration policies costituiscono l’ultimo elemento teorico mancante nella serie di argomenti introduttivi al magico mondo del Reinforcement Learning. Prima…
In quest post esploriamo l’algoritmo di Temporal Difference Learning e quello di Q-Learning. Nel nostro precedente post abbiamo visto come…
Il Markov Decision Process (MDP) o processo decisionale di Markov è un modello di gestione dello stato di transizione di…
Il Credit Assignment Problem è genericamente parlando il problema di determinare quale componente di un sistema contribuisca maggiormente al successo…
Il Reinforcement Learning, che mi rifiuto di tradurre in apprendimento per rinforzo, è uno dei temi più scottanti nel campo…
Con l’espressione Synthetic Data soliamo riferirci ai dati sintetici generati da una sistema, una macchina. Una definizione semplice, ma che…
Il Private Aggregation of Teacher Ensebles, meglio conosciuto come PATE framework, è un metodo di differential privacy che garantisce la…
Il TensorFlow Developer Certificate è il certificato ufficiale Google rilasciato a chiunque superi l’esame tecnico e dimostri la propria competenza…
Gli autoencoders sono reti neurali artificiali (neural networks) capaci di rappresentare in modo efficiente dati in input imparando i così…
La privacy è un fattore cruciale da tenere a mente nello sviluppo di nuovi sistemi e applicazioni. In questi giorni…