Una metodologia è un sistema di metodi utilizzabili in una particolare area di studi o attività. In questo primo post la Data Science Methodology: Business Understanding e Analytic Approach
Abbiamo già visto il funnel di un progetto di data science volto alla creazione del nostro portfolio, oggi analizziamo un approccio serio e professionale.
E’ importante formare anche la nostra mentalità.
La prima fase della metodologia è quella definita di Business Understanding
Business Understanding
Nella fase preliminare è fondamentale chiedere chiarimenti (seek clarification), investendo del tempo per fare chiarezza sul problema da risolvere.
Solo così è possibile determinare la tipologia di dati da ricercare per raggiungerne la soluzione.
E’ di vitale importanza quindi definire la domanda che meglio rappresenta il problema, e che guiderà le successive fasi di consulenza.
Vogliamo infatti evitare di perdere tempo nel rispondere a quesiti secondari, fonte di distrazione dal problema principale: nascostto o difficilmente individuabile dal cliente.
Qui entriamo in gioco noi.
Set the goal
Per definire la giusta domanda occorre dapprima individuare il goal ossia lo scopo del progetto.
Un esempio.
Cliente: "Come possiamo ridurre il costo di un processo lavorativo?" Data Scientist: "L'obiettivo è aumentare l'efficienza del processo? O la redditività?
Set the objectives
Chiarito lo scopo è necessario fissare l’obiettivo.
Dall’analisi dell’obiettivo, o degli obiettivi, nascono discussioni utili a determinare le priorità del problema.
Una volta stabilite fisseranno con maggior chiarezza l’organizzazione e la pianificazione delle attività con cui poterlo risolvere.
Il parere di diversi stakeholders costiuisce un valore aggiunto con cui fissare i requisiti e chiarire ulteriormente domande e dubbi.
Summary
Lo stage di Business Understanding è quindi importante perché definisce sia il problema che i bisogni da un punto di vista aziendale, business oriented.
Stabilito lo scopo e il problema da risolvere, è necessario individuare il migliore approccio analitico da intraprendere coerentemente con i requisiti aziendali richiesti.
Business Understanding | N26 Case Study
N26 è una banca tedesca che fornisce servizi finanziari ai clienti dell’Unione Europea.
Potresti trovare l’informazione che segue particolarmente utile.
Devi infatti sapere che da poco permette l’apertura di un conto bancario con IBAN Italiano: puoi ora avere molta più libertà di manovra.
Consigli a parte, esaminiamo come la fase di Business Understanding sia fondamentale con un esempio pratico nel fintech.
Immaginiamo la verosimile situazione in cui un Product Manager chieda a un Data Scientist:
Possiamo prevedere il risk score degli utenti smart?
Product Manager Question
Compito del Data Scientist è allora quello di elaborare la domanda facendo emergere il reale problema di fondo.
Coadiuvato dal domain knowledge, il data science può formulare una goal più chiaro:
Possiamo accuratamente prevedere la probabilità che un utente tedesco vada in default sull’overdraft (i.e. Estensione di credito garantita a un account con zero fondi) nei prossimi 12 mesi anche senza credit bureau history (i.e. Lo storico creditizio di un utente)
Data Scientist – Business Understanding
Ridotta la nebulosità del contesto possiamo ora procedere alla selezione dell’approccio risolutivo più appropriato.
Qui maggiori info.
Analytic Approach
In questa fase devi chiederti: “Come posso usare i dati per risolvere il problema?“
Poiché esistono multipli approcci analitici, per scegliere quello giusto occore prestare attenzione alla domanda fatta dal cliente.
Infatti solo dopo aver sviluppato una profonda comprensione della domanda puoi davvero essere certo che l’approccio analitico da te scelto sia il migliore.
Alcune tipologie di approcci:
- Descrittivo (cosa sta succedendo)
- Diagnostico, analisi statistica (cosa è successo, perché sta succedendo)
- Predititivo, previsionale (cosa accadrebbe se il trend continuasse, come accadrà dopo)
- Prescrittivo (come risolviamo il problema)
Alcuni esempi pratici:
- “Determina la probaiblità di questa azione” – Approccio predittivio
- “Determina l’esistenza di relazioni” – Approccio descrittivo, con creazione di modello di clustering
- “Rispondi si o no” – Creazione di un modello di classificazione
Nel prossimo post analizziamo le successivie fasi della data science methodology: