Blog.

Portfolio data scientist? Come realizzarne uno | Consigli Italiano


Autore
Andrea Provino
Data
Tempo di lettura
5 minuti
Categoria
Guide, Portfolio

consigli-data-science-portfolio-machine-learning-portfolio-blog-passione-data-guida-italiano-linkedin

Cerchi idee per un portfolio data scientist che attiri l’attenzione, dimostri le tue competenze e rappresenti una valida alternativa al CV data scientist?

Sei nel posto giusto.

Continua a leggere…

Il nostro obiettivo è semplice: realizzare un portfolio data scientist di progetti da presentare alle aziende, che attesti la nostra bravura.

Mi chiamo Andrea Provino e ti guiderò in questa avventura.

Individuata la meta, passiamo all’azione.

Portfolio Data Scientist

In questo post vediamo dunque alcuni consigli utili per presentare al meglio la nostra figura professionale in un mondo del lavoro sempre più competitivo.

Come dice il nostro caro amico Seth: devi avere il data science portoflio di una mucca viola!

Procediamo in questo modo, seguimi!

Prima vediamo dei riferimenti generici, con concetti chiari e definiti da integrare nel nostro portoflio data scientist.

Poi osserviamo alcuni esempi pratici, degli case study, da cui trarre ispirazione.

Passion

Il primo elemento che il tuo portfolio data scientist deve avere è la passion.

La passione deve diventare la tua arma primaria, e per un semplice motivo.

Stanchezza e paura possono essere vinte solo da un cuore impavido.

Perseverare, un fallimento dopo il successivo, è cosa ardua. Il tuo unico compagno di viaggio sarà lei, sempre pronta a sostenerti.

Cerca il tuo why?, trovalo e conquista il mondo con la forza dirompente della tua passione.

Trasmettine ogni briciolo un progetto dopo l’altro: potrai sempre studiare machine learning, ma nessuno allenerà mai la tua passione.

Per questa ragione la passione è dote rara e preziosa.

Focus on the problem

Un portfolio davvero unico oltre a contenere risposte, presenta le giuste domande.

È semplice realizzare progetti basandosi sui problemi di piattaforme online come Kaggle.

Il problema è noto, e presentato su un piatto d’argento.

Difficile cosa è inquadrare le richieste di un ipotetico customer, immaginare di dialogare con più stakeholders comprendere le loro necessità e sintetizzarle in un problema da risolvere con l’ausilio delle intelligenze artificiali.

A questo proposito può tornare utile esaminare le fasi della Data Science Methodology.

Nel concreto infatti una delle challenge più grandi è convertire un business problem in un valido progetto di data science. Una skill che vale oro nel nostro portfolio!

A matter of data

Ti ricordi la regola 1? Come ni?

better data defeat fancier algorithms

I dati più rappresentativi sono in possesso delle grandi aziende, e spesso capita che a noi ne rimangano pochi, e non sempre di buona qualità

Abbiamo visto una possibile soluzione in passato, ora però vogliamo trasmettere tutta la nostra fame d’intraprendenza.

A questo proposito inserire nel nostro portfolio una bella storia di come abbiamo trascorso gli ultimi mesi a vagare tra le corsie di un supermercato per catturare foto di scaffali semi vuoti e realizzare il nostro personale modello assume una grande rilevanza.

Dimostra di essere disposto persino a creare il tuo dataset pur di fare del machine learning! Cavolo se ti assumeranno!

Act like an explorator

Mettiti in testa una cosa: sei il più bravo esploratore esistente.

Devi esserlo.

I dati per te non hanno segreti. A questo punto puoi procedere oltre.

Una fase cruciale, importante e delicata, di un processo di machine learning è quella di features engineering. Come puoi pensare di combinare dati se non conosci la loro natura?

  • Ci sono outliers?
  • Esiste correlazione?
  • La qualità del dataset?

Seaborn e Pandas Profiling sono potenti strumenti utili e con una ricca documentazione.

Storytelling

Ahimè una skill sottovalutata.

Quando diciamo che la figura del data scientist ricorda l’unicorno, animale leggendario, non scherziamo.

Curiosità, intraprendenza, follia, matematica, statistica, programmazione e persuasione sono alcune abilità fondamentali. La lista continua con quella di storytelling.

Un bravo data scientist racconta una storia con i dati che ha manipoalto.

Gli insights sono risultati rilevanti: saperli comunicare efficacemente è mandatorio!

Domain Knowledge

L’ingrediente fondamentale che fa di te una mucca viola, o unicorno, è senz’altro l’apporto unico e particolare che puoi conferire al tuo settore o dominio.

È l’ambito in cui lavori, o quello che maggiormente attira la tua attenzione: crescita personale, sport, medicina, risorse umane, finanza, agricoltura, etc.

Usando un’espressione più tecnica è il domain knowledge. Cura ogni progetto esaltando questo aspetto per fare colpo!

Idee portfolio Data scientist

Non è finita qui.

Diamo ora uno sguardo a chi è più esperto di noi: traiamo spunto, copiamo ma sopratutto innoviamo aggiungendo un tocco unico!

David Venturi

Un ragazzo che ha realizzato diversi corsi per DataCamp e Udacity nonché scritto articoli su Medium con decine di migliaia di apprezzamenti.

Il suo sito portfolio (davidventuri.com/portfolio) riflette propriamente i suoi molti talenti.

Intendo farti notare l’organizzazione dei contenuti e la scelta del font, elementi che chiaramente devono essere considerati.

Ciò che più colpisce è però la chiarezza con cui David trasmette gli esatti risultati che in grado di raggiungere.

In altri termini, ogni sezione del suo portfolio ha una finalità di marketing: vende David Venturi.

Persino i suoi documenti scritti ci suggeriscono preziosi consigli.

Ogni elemento ha infatti una audience chiara fin da subito: che si tratti di un report, di un articolo o un blogpost.

Hannah Yan Han

Il portfolio di Hannah (www.hannahyan.com) mette in luce in pochi secondi le sue superbe abilità di data visualization.

Attraverso un visualizzazione semplice ma efficace, trasmette istantaneamente le sue abilità tecniche con l’uso di framework e linguaggi specifici, tra cui R, D3.js e P5.js.

Competenza, serietà e capacità di comunicazione condivise ineccepibilmente.

Donne Martin

Donne (www.donnemartin.com) adotta una strategia sublime.

Invece di presentare e descrivere i progetti, lascia che sia il feedback della community a parlare.

Decine di progetti con migliaia e migliaia di apprezzamenti.

Sul suo profilo GitHub David ha persino creato una repository di Jupyter Noteboos ordinata e densa di contenuto.

C’è poco da dire: quando sei bravo non è difficile mettersi in luce.

Claudia Ten Hoope

Caludia (www.claudiatenhoope.com) ha optato per una soluzione pulita, ordinata e di facile lettura.

Il suo Data Science Portfolio è una vera e propria brochure con tanto di tariffario, chiaramente associato a un preciso elenco di competenze.

La sua comunicazione è orientata a un pubblico inesperto, con spiegazioni chiare e concise, e un uso centellinato di termini tecnici.

Per il momento è tutto.

Per aspera, ad astra

Un caldo abbraccio, Andrea.

Taggeddata scienceguidaportfolio project


Ultimi post

Patricia Merkle Trie

Il Practical Algorithm To Retrieve Information Coded In Alphanumeric Merkle Trie, o Patricia Merkle Trie è una struttura dati chiave-valore usatada Ethereum e particolarmente efficiente per il salvataggio e la verifica dell’integrità dell’informazione. In questo post ne studieremo le caratteristiche. Prima di procedere, ci conviene ripassare l’introduzione al Merkle Tree nella quale abbiamo chiarito il […]

Andrea Provino
ethereum-patricia-merkle-tree
Tree Data Structure: cos’è un Merkle Tree

Un Merkle Tree è una struttura dati efficiente per verificare che un dato appartenga a un insieme esteso di elementi. È comunemente impiegato nelle Peer to Peer network in cui la generazione efficiente di prove (proof) contribuisce alla scalabilità della rete. Capire i vantaggi di questa struttura ci tornerà utile nel nostro percorso di esplorazione […]

Andrea Provino
merkle-tree-cover
UTXO: come funziona il modello Unspent Transaction Outputs

Per tenere traccia dei bilanci utente, la blockchain di Bitcoin sfrutta un modello di contabilità definito UTXO o Unspent Transaction Outputs. In questo articolo ne esaminiamo le caratteristiche. Ogni blockchain è dotata di un sistema di contabilità, un meccanismo attraverso cui tenere traccia dei bilanci di ciascun utente. I due grandi modelli di riferimento nel […]

Andrea Provino
bitcoin-utxo
Cos’è Ethereum

Possiamo definire Ethereum come una macchina a stati distribuita che traccia le transizioni di un archivio dati general-purpose (i.e. una memoria in grado di registrare qualsiasi dato esprimibile come coppia di chiave e valore o key-value) all’interno della Ethereum Blockchain. È arrivato il momento di esplorare uno dei progetti tecnologici più innovativi e interessanti degli […]

Andrea Provino
ethereum