Dopo aver studiato le basi teoriche del Reinforcement Learning, ci rimangono due grandi ambiti: i reinforcement learning use cases e la pratica! La prima cosa che abbiamo fatto è stata introdurre il Reinforcement Learning. Avendo optato per un approccio europeo allo studio, sapevamo che avremmo prima considerato la teoria e in seguito la pratica. Questa […]
Le exploration policies costituiscono l’ultimo elemento teorico mancante nella serie di argomenti introduttivi al magico mondo del Reinforcement Learning. Prima di procedere, un attimo di ambientazione. Come ben sai, su questo blog, a spiegazioni impegnative siamo soliti associare brevi interruzioni di natura ludica. Un elemento ricorrente è senza dubbio la metafora del marinaio del capitano. […]
In quest post esploriamo l’algoritmo di Temporal Difference Learning e quello di Q-Learning. Nel nostro precedente post abbiamo visto come Bellman riusci a individuare un metodo efficace per calcolare l’optimal state value di ogni stato. Conoscere questo valore è utile, in particolare per valutare una policy, ma non comunica espressamente all’agente cosa fare. Bellman ci […]
Il Markov Decision Process (MDP) o processo decisionale di Markov è un modello di gestione dello stato di transizione di un agente in un ambiente dinamico e casuale, dunque non deterministico. Fornisce un modello matematico per modellare un processo decisionale in quelle situazioni in cui il risultato è parzialmente casuale (random), e in parte sotto […]
Il Credit Assignment Problem è genericamente parlando il problema di determinare quale componente di un sistema contribuisca maggiormente al successo del sistema stesso. Trattando di machine learning, ed essendo questo un post sul Reinforcement Learning dobbiamo certamente andare nello specifico. Diciamo allora che nel Reinforcement Learning il Credit Assignment Problem è il problema di determinare […]
Il Reinforcement Learning, che mi rifiuto di tradurre in apprendimento per rinforzo, è uno dei temi più scottanti nel campo del Machine Learning. È anche uno dei più vecchi: devi sapere che i primi accenni a questa area di studi risalgono agli anni ’50 del secolo scorso! La storia tende a essere ritenuta noiosa, sebbene […]
Open AI è un’organizzazione non profit di ricerca sull’intelligenza artificiale fondata da Elon Musk e Sam Altman. Nel 2016 nasce Open AI Gym, un toolkit per l’allenamento di agenti di Reinforcement Learning. Il 21 novembre 2019 Open AI Safety Gym è rilasciato. Open AI Safety Gym è una suite di ambienti e strumenti per misurare […]
OpenAI Gym è un toolkit per lo sviluppo e la comparazione di algoritmi di reinforcement learning che supporta l’allenamento di differenti tipologie di agenti. Nel 2015, Elon Musk e Sam Altman, un mito dal cui blog dovremmo apprendere molto, fondarono un’organizzazione non profit con lo scopo di promuovere la ricerca nel campo delle intelligenze artificiali, […]