Gli ultimi post di "reinforcement-learning"

Reinforcement Learning Use Cases | Business Mindset

Dopo aver studiato le basi teoriche del Reinforcement Learning, ci rimangono due grandi ambiti: i reinforcement learning use cases e la pratica! La prima cosa che abbiamo fatto è stata introdurre il Reinforcement Learning. Avendo optato per un approccio europeo allo studio, sapevamo che avremmo prima considerato la teoria e in seguito la pratica. Questa […]

Andrea Provino
reinforcement-learning-use-cases-guida-italiano-esempi-reinforcement-learning-italia
Exploration Policies: ε-greedy policy | Reinforcement Learning

Le exploration policies costituiscono l’ultimo elemento teorico mancante nella serie di argomenti introduttivi al magico mondo del Reinforcement Learning. Prima di procedere, un attimo di ambientazione. Come ben sai, su questo blog, a spiegazioni impegnative siamo soliti associare brevi interruzioni di natura ludica. Un elemento ricorrente è senza dubbio la metafora del marinaio del capitano. […]

Andrea Provino
exploration-policies-exploration-policy-reinforcement-learning-machine-learning-data-science-markov-decision-process
Temporal Difference Learning and Q-Learning

In quest post esploriamo l’algoritmo di Temporal Difference Learning e quello di Q-Learning. Nel nostro precedente post abbiamo visto come Bellman riusci a individuare un metodo efficace per calcolare l’optimal state value di ogni stato. Conoscere questo valore è utile, in particolare per valutare una policy, ma non comunica espressamente all’agente cosa fare. Bellman ci […]

Andrea Provino
reinforcement-learning-deep-learning-data-science-machine-learning-temporal-difference-learning-q-learning-spiegazione-italiano
Tutto sul Markov Decision Process (MDP) | Reinforcement Learning

Il Markov Decision Process (MDP) o processo decisionale di Markov è un modello di gestione dello stato di transizione di un agente in un ambiente dinamico e casuale, dunque non deterministico. Fornisce un modello matematico per modellare un processo decisionale in quelle situazioni in cui il risultato è parzialmente casuale (random), e in parte sotto […]

Andrea Provino
deep-learning-reinforcement-learning-markov-decision-process-processes-markov-chain-example-markov-process-example-italiano-spiegazione-processo-decisionale-markov
The credit assignment problem | Reinforcement Learning

Il Credit Assignment Problem è genericamente parlando il problema di determinare quale componente di un sistema contribuisca maggiormente al successo del sistema stesso. Trattando di machine learning, ed essendo questo un post sul Reinforcement Learning dobbiamo certamente andare nello specifico. Diciamo allora che nel Reinforcement Learning il Credit Assignment Problem è il problema di determinare […]

Andrea Provino
the-credit-assignment-problem-reinforcement-learning-machine-learning-data-science-deeplearning
Reinforcement Learning in Italiano: breve introduzione

Il Reinforcement Learning, che mi rifiuto di tradurre in apprendimento per rinforzo, è uno dei temi più scottanti nel campo del Machine Learning. È anche uno dei più vecchi: devi sapere che i primi accenni a questa area di studi risalgono agli anni ’50 del secolo scorso! La storia tende a essere ritenuta noiosa, sebbene […]

Andrea Provino
reinforcement-learning-data-science-machine-learning-guida-italiano-spiegazione-semplice-neural-network
Open AI Safety Gym per Reinforcement Learning

Open AI è un’organizzazione non profit di ricerca sull’intelligenza artificiale fondata da Elon Musk e Sam Altman. Nel 2016 nasce Open AI Gym, un toolkit per l’allenamento di agenti di Reinforcement Learning. Il 21 novembre 2019 Open AI Safety Gym è rilasciato. Open AI Safety Gym è una suite di ambienti e strumenti per misurare […]

Andrea Provino
open-ai-safety-gym-cover-italiano-data-science-blog-guida-machine-learning-deep-reinforcement-learning
OpenAI Gym Cartpole | Sviluppo Reinforcement Learning Algorithm

OpenAI Gym è un toolkit per lo sviluppo e la comparazione di algoritmi di reinforcement learning che supporta l’allenamento di differenti tipologie di agenti. Nel 2015, Elon Musk e Sam Altman, un mito dal cui blog dovremmo apprendere molto, fondarono un’organizzazione non profit con lo scopo di promuovere la ricerca nel campo delle intelligenze artificiali, […]

Andrea Provino
openAI-gym-carpole-tutorial-reinforcemente-learning-guida-italiano-machine-learning-deep-learning-tutorial-blog