Blog.

Il ruolo del data scientist: perché è importante?


Autore
Andrea Provino
Data
Tempo di lettura
5 minuti
Categoria
Data Science

ruolo-del-data-scientist-data-scientist-role-machine-learning-data-science-blog-italia

Demistifichiamo il ruolo del data scientist, chiarendone l’utilità più che mai attuale, in un contesto in cui nuovi tool di analisi sembrano poter facilmente sostituire figure esperte.

A inizio anno abbiamo esaminato quali potessero essere delle buone Skill da Approfondire.

Oggi facciamo un’analisi più generale, con alcune riflessioni.

Partiamo!

Una situazione realistica

Siamo in un’azienda di piccole, o medie dimensioni.

Immaginiamo che un dipendente abbia l’incarico di organizzare e guidare il reparto di analisi dati.

Il suo capo, ignorante in materia, gli ha fornito un budget ridicolo, certamente insufficiente, per niente consapevole dei vantaggi derivanti da un approccio data driven.

Non avendo ancora conosciuto questo blog, il giovane esemplare di dipendente selvatico brancola nel buio e davanti a lui un dilemma:

  • Assumere 2 esperti. Opzione costosa e spaventosa, poiché non ha la minima idea di quale sia il ruolo del data scientist.
  • Acquistare un tool di analisi. Scelta più conservativa, senz’altro vista di buon occhio dal capo, che avrebbe così una persona in meno a cui pagare lo stipendio.

La seconda decisione è molto allettante.

Appena qualche ricerca in rete, magari attraverso le classiche parole chiave del dominio di Business Intelligence, e riesce facilmente a trovare strumenti di analisi tanto decantati da sembrare la soluzione perfetta a ogni suo problema.

Segmentazione utenti, retention, analisi flussi, grafici colorati, tabelle piene di dati, elenchi infiniti di funzionalità che mai userà.

Appena sotto la soglia psicologica dei mille euro mensili, con tanto di assistenza tecnica dedicata h24.

Come se il suo business richiedesse un tecnico specializzato operativo alle 3 di notte.

Spoiler: non lo richiede!

La distrazione dei colori accesi, delle frasi motivanti, dei loghi di aziende in bianco e nero di cui mai ha sentito parlare, ma che certamente pensa debbano essere importanti, lo spinge all’acquisto.

Boom: 10k € per un anno, e pensa che la serenità sia inclusa.

Pochi mesi dopo, il team Data Science è chiuso per scarsa produttività.

Il sottovalutato ruolo del Data scientist

Ovviamente è una storia verosimile, e non tutte le aziende si trovano in un tale stato d’incompetenza.

Anzi, nelle realtà in cui l’innovazione è vista di buon occhio, il ruolo del Data Science Leader, colui che individua le aree in cui l’applicazione della data science si rivela efficace, è riconosciuto come fondamentale.

Esistono però molte più situazioni in cui, arrogarsi il titolo di esperto è tanto semplice quanto inutile: tutti diventano scienziati dei dati grazie a Google Analytics e simili.

La realtà è un altra.

Il Data Scientist è una figura esperta, ma in Italia sottovalutata.

Il tuo ricco portfolio, creato seguendo anche questi ottimi consigli, non basta.

È sufficiente confrontare lo stipendio medio annuale del data scientist statunitense e quello italiano, per capire quanto questa professione vanti scarsa considerazione e importanza.

L’analisi Glassdoor, una piattaforma di condivisione anonima dei salari, evidenzia come nel paese a stelle e strisce la media salariale sia di $ 100k, cifra che scende a 32k € in Italia.

Stiamo scherzando?

Assolutamente no: questo è il prodotto di un paese in cui più sai, meno vali, e tanto meglio fingi di sapere quanta maggiore considerazione ottieni.

Il nostro paese non sa valorizzare i propri talenti: io credo dipenda da tanta ignoranza diffusa.

Curioso di conoscere anche la tua opinione!

Riflessioni polemiche a parte….

Perché il ruolo del data scientist è cruciale oggi più che mai

Partendo dall’interessante post di RStudio, l’IDE (Integrated Development Environemnt) per il linguaggio di analisi R, ha senso riflettere su come l’attuale crisi sanitaria abbia ulteriormente avvolto di paura, incertezza e dubbio, o FUD (Fear, Uncertainty and Doubt) il ruolo del Data Scientist.

Il licenziamento di 1900 persone eseguito da AirBnb, gruppo in cui compaiono parecchi Data Scientist, sembra confermare questa tendenza.

Io ti propongo almeno tre motivi per cui queste sensazioni sono invece totalmente ingiustificate.

Prima di vederle, ricordiamoci cosa significhi davvero fare data science.

Sinteticamente?

Produrre il massimo valore possibile per la nostra azienda sfruttando i dati, ed efficaci strumenti quali:

  • Modelli di machine learning
  • Grafici e report
  • il proprio domain knowledge

Ciò detto, proseguiamo.

Identificare e risolvere problemi complessi

Gli strumenti comuni sono utili per problemi noti, come l’estrazione e la visualizzazione di dati strutturati.

In questi casi c’è poco che un bravo data scientist possa aggiungere a una suite ad-hoc.

Possiamo però sottolineare anche un altro fondamentale concetto.

La risoluzione di problemi complessi non può essere automatizzata, ed è proprio questo ciò verso cui le aziende dovrebbero muoversi: puntare ai problemi difficili non ancora completamente capiti.

Evidentemente la soluzione a questi problemi ancora da risolvere è il terreno fertile per un buon lavoro di data science.

No, se cerchi qualcuno che ti spieghi i grafici di Google Analytics non hai bisogno di un Data Scientist: è sufficiente leggere un po’.

Data-Driven decision-making

Ieri, l’era delle decisioni strategiche prese intuitivamente.

Oggi, un mercato così competitivo da richiedere un nuovo approccio: quello data-driven.

Nel 2014 McKinsey & Company condusse uno studio sui vantaggi di un simile cambiamento di mentalità.

Il risultato?

+23% in acquisizione utenza rispetto ai competitors e +19% di probabilità di raggiungere un redditività superiore alla media.

Capisci perché oggi più che mai devi sviluppare una strategia basata sui dati?

La domanda dei tools ai massimi livelli

Nessuno intende sottovalutare la situazione economica attuale.

Sappi dunque una cosa cruciale.

Avere buoni risultati risparmiando è fattibile.

La cummunity di sviluppatori è stata in grado di produrre negli anni ottimi e validi tool open source, e molte aziende stanno ora puntando su queste soluzioni.

Invece di acquistare gli strumenti, investi sulle persone: un asset fondamentale.

Per il momento è tutto.

Un caldo abbraccio, Andrea.

Taggedconsiglidata sciencedata scientist


Ultimi post

Patricia Merkle Trie

Il Practical Algorithm To Retrieve Information Coded In Alphanumeric Merkle Trie, o Patricia Merkle Trie è una struttura dati chiave-valore usatada Ethereum e particolarmente efficiente per il salvataggio e la verifica dell’integrità dell’informazione. In questo post ne studieremo le caratteristiche. Prima di procedere, ci conviene ripassare l’introduzione al Merkle Tree nella quale abbiamo chiarito il […]

Andrea Provino
ethereum-patricia-merkle-tree
Tree Data Structure: cos’è un Merkle Tree

Un Merkle Tree è una struttura dati efficiente per verificare che un dato appartenga a un insieme esteso di elementi. È comunemente impiegato nelle Peer to Peer network in cui la generazione efficiente di prove (proof) contribuisce alla scalabilità della rete. Capire i vantaggi di questa struttura ci tornerà utile nel nostro percorso di esplorazione […]

Andrea Provino
merkle-tree-cover
UTXO: come funziona il modello Unspent Transaction Outputs

Per tenere traccia dei bilanci utente, la blockchain di Bitcoin sfrutta un modello di contabilità definito UTXO o Unspent Transaction Outputs. In questo articolo ne esaminiamo le caratteristiche. Ogni blockchain è dotata di un sistema di contabilità, un meccanismo attraverso cui tenere traccia dei bilanci di ciascun utente. I due grandi modelli di riferimento nel […]

Andrea Provino
bitcoin-utxo
Cos’è Ethereum

Possiamo definire Ethereum come una macchina a stati distribuita che traccia le transizioni di un archivio dati general-purpose (i.e. una memoria in grado di registrare qualsiasi dato esprimibile come coppia di chiave e valore o key-value) all’interno della Ethereum Blockchain. È arrivato il momento di esplorare uno dei progetti tecnologici più innovativi e interessanti degli […]

Andrea Provino
ethereum