Blog.

Data Scientist vs Data Analyst


Autore
Andrea Provino
Data
Tempo di lettura
5 minuti
Categoria
Data Science, machine-learning

data-scientist-vs-data-analyst-skills-stipendio-salary

Qual è la differenza tra Data Scientist vs Data Analyst ? Vediamo insieme le sfaccettature di queste due professioni, spesso fraintese.

Mi chiamo Andrea Provino, e questo che stai leggendo è un post di un blog che mi sento condividere con te.

Continua a leggere…

Devi sapere una cosa.

Ho deciso di documentare il mio percorso di formazione redigendo post su molteplici tematiche in ambito data sicence, machine learning e, più di recente, sulle tecnologie di tutela della privacy applicate al ML.

Lo faccio per aiutare appassionati e curiosi che, come noi, sono interessati a navigare nelle maestose acque della conoscenza.

Allora lascia che ti dica una cosa.

In questo avventuroso e sorprendente viaggio, ho scoperto una verità salata.

In questi affascinanti mondi, esiste un divario.

Un grande divario di consapevolezza tra il nostro mercato lavorativo e quello dei paesi in cui la rivoluzione è giunta prima.

Questo post vuole allora colmare, nel suo piccolo, una lacuna riguardante due professioni spesso fraintese: il lavoro del data scientist vs data analyst

Perché c’è confusione tra Data Scientist vs Data Analyst?

Esiste una gray area tra i due mondi.

In Italia, come in pochi altri paesi, abbiamo ereditato dalla nostra cultura un ragionamento orientato al risultato.

Qua potremmo aprire una grande parentesi, ma rimaniamo sull’argomento.

In pratica, visualizziamo chiaramente dove vogliamo arrivare e poco importa, a volte, come ci arriviamo.

Questa mentalità produce in ambito lavorativo scenari poco piacevoli.

Ad esempio, significa che se entro venerdì il tuo responsabile deve fare bella figura e presentare un power point con le ultime metriche di utilizzo della piattaforma, e a te che si rivolge.

Ah, ma non sei un data scientist?

Esatto.

Abbiamo visto perché questo ruolo sia rilevante nelle aziende.

Ciò non implica affatto che la sola presenza della parola data debba far attirare a te ogni task anche solo lontanamente legato all’analisi di una parola.

Ovviamente non tutte le aziende versano in uno stato di simile abbandono, e chiaramente il ruolo del data scientist è sempre meno nebuloso.

Resta il fatto che qualche dubbio sulle attuali responsabilità dei ruoli è sempre possibile: al termine di questo post, non lo sarà più.

Senza ulteriori indugi: scopriamo le differenza tra Data Scientist e Data Analyst: due professioni egualmente valide e professionali, sovente confuse.

Data Analyst

La figura professionale del Data Analyst si limita a estrarre informazioni significative dai dati.

Per farlo, cerca nuovi punti di vista che facciano emergere preziosi tesori.

A partire da una serie di domande, spesso sorte in una fase di business understanding, il Data Analyst trova le risposte per affrontare specifici problemi nei dati.

Il suo focus e nell’analisi del passato e della sua descrizione.

Questo lo rende una figura molto legata alle esigenze del business, e spesso direttamente sottoposta a quelle dei clienti.

Vediamo le sue responsabilità:

  • Scrittura query SQL per rispondere a complesse domande di business (i.e. Retention mensile utenti, calcolo LTV medio, annual recurring revenue, etc)
  • Analisi dati per individuazione correlazione e pattern
  • Sviluppo nuove metriche per una maggiore comprensione del business
  • Coordinazione con gli ingegnerie per raccolta nuovi dati
  • Migliorare il decision making dei business executive attraverso report chiari e puntuali
  • Applicazione dell’analisi statistica

Data Scientist

La figura professionale del Data Scientist analizza i dati passati, individuando pattern che consentano di prevedere andamenti futuri.

Nel suo lavoro di analisi iterativa e multifasica (i.e. Espressione colta per dire che quando si accorge di essere in un vicolo cieco, torna indietro e genera nuove ipotesi) crea e risponde a nuove domande che egli stesso si pone.

Il suo focus è nel conferire all’azienda il massimo valore attraverso l’analisi dei dati, con attenzione alle condizioni ipotetiche future (i.e. Cosa accadrebbe se…).

In generale, è una figura con ben più libertà operativa del Data Analyst.

Tra le sue responsabilità, ecco le più importanti:

  • Massimizzare il valore dei dati trovando nuove feature
  • Pulizia ed elaborazione dati per analisi
  • Identificazione di nuove domande (i.e. Le cui risposte, quando ottenute, aggiungono disruptive value all’azienda)
  • Correlazione di set dati differenti
  • Conduzione di esperimenti attraverso l’applicazione dell’A/B testing o tramite approccio epidemiologico per l’individuazione delle cause per gli effetti osservati.
  • Data Storytelling e Data Visualization.

Ok, ora che abbiamo delineato i tratti distintivi delle due figure, scaviamo più a fondo.

Differenze Data Analyst vs Data Scientist

Il Data Scientist sfrutta tutte le sue competenze in Data Visualization per presentare le scoperte con l’ausilio di uno story telling ad-hoc, rivolto ai stakeholders.

Lo fa assicurandosi che la sua influenza nell’azienda sia massima, guidandola verso nuove ambiziose sfide.

Questo richiede una profonda conoscenza del business aziendale, concetto che sintetizziamo nel così detto domain knowledge: la conoscenza del dominio in cui si opera.

Oltre a questo, un buon Data Scientist ha il senso degli affari (business acumen).

Un Data Analyst non ha necessariamente bisogno delle medesime capacità presentative e comunicative, e certamente l’acume negli affari non è richiesto.

Una’altra differenza è l’origine e la forma dei dati.

Il Data Scientist opera con sorgenti disconnesse e talvolta distribuite, contrariamente al Data Analyst che generalmente analizza dati da sorgente unica, come un sistema CRM.

La diversificazione dei ruoli è evidente anche negli strumenti usati.

Un Data Scienist può fare ricorso a modelli statistici e a sistemi di machine learning, capacità che non vengono richieste a un Data Analyst.

Stipendio data scientist vs stipendio data analyst

Arriviamo ora a una delle voci che suscitano più attenzione.

Dato l’enorme bagaglio di competenze, e soft-skills, richieste a un Data Scientist non c’è da stupirsi che questa figura sia retribuita con un salario più alto del Data Analyst.

Tuttavia, lo stesso inquadramento ha variazioni salariali significative in funzione del mercato in cui si opera, o perlomeno questo è quanto avviene negli Stati Uniti.

Consideriamo infatti questo paese per almeno due ragioni:

  • il numero di campioni è significativo, quindi possiamo aspettarci valori più attendibili.
  • la Data Culture è diffusa nelle aziende e il rispetto per questi ruoli segue a ruota.

Lo stipendi medio annuale di un Data Scientist è di $113k (6k campioni), mentre la media per un Data Analyst si ferma a $63$ (Glassdoor).

In Europa, prendendo un paese come la Germania per riferimento, la situazione cambia con un divario quasi assente.

Lo stipendio del primo scende a 59k € (327 campioni) e a 54k € (161 campioni) il secondo. (Glassdoor).

Per il momento è tutto.

Per aspera, ad astra.

Un caldo abbraccio, Andrea

Taggedbusinessdata sciencedata scientistjob and careers


Ultimi post

Patricia Merkle Trie

Il Practical Algorithm To Retrieve Information Coded In Alphanumeric Merkle Trie, o Patricia Merkle Trie è una struttura dati chiave-valore usatada Ethereum e particolarmente efficiente per il salvataggio e la verifica dell’integrità dell’informazione. In questo post ne studieremo le caratteristiche. Prima di procedere, ci conviene ripassare l’introduzione al Merkle Tree nella quale abbiamo chiarito il […]

Andrea Provino
ethereum-patricia-merkle-tree
Tree Data Structure: cos’è un Merkle Tree

Un Merkle Tree è una struttura dati efficiente per verificare che un dato appartenga a un insieme esteso di elementi. È comunemente impiegato nelle Peer to Peer network in cui la generazione efficiente di prove (proof) contribuisce alla scalabilità della rete. Capire i vantaggi di questa struttura ci tornerà utile nel nostro percorso di esplorazione […]

Andrea Provino
merkle-tree-cover
UTXO: come funziona il modello Unspent Transaction Outputs

Per tenere traccia dei bilanci utente, la blockchain di Bitcoin sfrutta un modello di contabilità definito UTXO o Unspent Transaction Outputs. In questo articolo ne esaminiamo le caratteristiche. Ogni blockchain è dotata di un sistema di contabilità, un meccanismo attraverso cui tenere traccia dei bilanci di ciascun utente. I due grandi modelli di riferimento nel […]

Andrea Provino
bitcoin-utxo
Cos’è Ethereum

Possiamo definire Ethereum come una macchina a stati distribuita che traccia le transizioni di un archivio dati general-purpose (i.e. una memoria in grado di registrare qualsiasi dato esprimibile come coppia di chiave e valore o key-value) all’interno della Ethereum Blockchain. È arrivato il momento di esplorare uno dei progetti tecnologici più innovativi e interessanti degli […]

Andrea Provino
ethereum