• 🏡 Home
  • 🚨 GDPR Compliant
  • ⚡️ Data Science
  • 📌 Machine Learning
  • 🔒 Privacy Preserving
  • 🏡 Home
  • 🚨 GDPR Compliant
  • ⚡️ Data Science
  • 📌 Machine Learning
  • 🔒 Privacy Preserving
Data Science, machine-learning, Portfolio

Junior Data Scientist: metodo generalizza e rifletti

Junior Data Scientist: metodo generalizza e rifletti

Un Junior Data Scientist ha tanto da imparare, ma è un asset prezioso per l’azienda. Ha una mindset elastico e un cervello con proprietà d’assorbimento di una spugna.

Un giovane Junior Data Scientist, giova delle straordinarie potenzialità della sua mente.

Un saggio Junior Data Scientist, forgiato da un settore esterno e poi convertito all’analisi dati, giova del domain knowledge accumulato negli anni

Cosa li accomuna? Un percorso in genere self-taught, in cui a competenze teoriche, certificate da attestati, e progetti pratici ben esposti sul CV, sono associate un mindset di soft-skills che ben lo inseriscono nel team aziendale.

Sappiamo che quello dell’autodidatta è un percorso in perenne salita, con qualche momentaneo pianeggiante altopiano che conduce a una nuova scalata al cardiopalmo.

Questo per essere riduttivi. Ovviamente.

Perché è così difficile?

Perché non puoi limitarti a imparare regole, definizioni e algoritmi, né svolgere qualche analisi del dataset su un jupyter notebook, magari persino online usando Google Coalab.

Non basta.

Potresti conquistare le competizioni di kaggle. Raggiungere la vetta delle classifiche certo è ragguardevole, tuttavia non è sufficiente a fare di te un bravo data scientist.

Ecco perché oggi intendo condividere con il metodo del generalizza e rifletti

Junior Data Scientist: il metodo generalizza e rifletti

Esiste una definizione condivisa di Data Scientist, tuttavia è arduo delinearne il profilo tecnico in modo assoluto poiché cambia dalle esigenze di ciascuna azienda.

Certo gli ambiti teorici generali sono noti, ma la specializzazione legata prevalentemente all’uso di determinate tecnologie dipende ovviamente dal sistema IT dell’azienda.

Per non divagare troppo, approfondiremo questa tematica in un post separato.

Ora concentriamoci sul metodo generalizza e rifletti.

Generalizza

I progetti personali che accompagnano un corso online, o quelli che decidiamo di sviluppare autonomamente ci aiutano ad accrescere chiaramente le hard-skill, mentre tendiamo a sottovalutare la loro efficacia nel miglioramento della mentalità, del ragionamento.

Un problema di digit-recognition può essere risolto come task di classificazione usando il popolare MNIST Dataset.

Abbandonato a sé stesso, sarebbe completamente inutile.

Le aziende non hanno bisogno di classificare cifre scritte a mano.

Forse qualcuna…

Il punto è un altro.

Alle aziende serve qualcuno che prenda le email e crei un sistema che prontamente le divida in spam, volgari e necessarie d’intervento umano.

Questo è un problema di classificazione!

Lo vedi il punto?

È poco interessante sapere classificare cifre scritte a mano, al contrario è molto utile saper risolvere un problema di classificazione, magari anche in modo veloce, dopo averlo prontamente riconosciuto.

In una parola: generalizzare.

Dobbiamo saper generalizzare da un problema specifico, estraniarlo dal suo dominio e usarlo come mattone da costruzione per qualcosa di più grande.

In questo modo il problema diventa davvero nostro: lo capiamo e comprendiamo a fondo.

Rifletti

Generalizzare non è sufficiente.

Occorre anche riflettere sul processo di sviluppo.

È possibile cambiare l’algoritmo x con quello y ?

Le prestazioni sarebbero differenti? Possiamo migliorarle?

È proprio necessario l’impiego del machine learning?

Usare una rete neurale, seppur basilare, per convertire i gradi celsius in fahrenheith è chiaramente un’esagreazione.

Offuscati dall’idea di migliorare ogni processo aziendale con l’ausilio di machine learning, deep learning e reinforcement learning perdiamo facilmente di vista il focus: questi sistemi sono strumenti, mezzi; il risultato è conferire valore.

Un valore che spesso deve essere raggiunto in breve tempo, magari con un MVP (Minimum Valuable Product) senza investire risorse in ottimizzazioni superflue.

Allora quello che dovremo chiederci davvero è: esistono algoritmi semplici per risolvere il problema?

La fase inizia di Business Understanding è qui fondamentale.

Riflettere.

Sempre.

Rimanendo in tema, intendo concludere questo post con una riflessione.

Dobbiamo allenarci per il mindset, non solo per le skill.

Un caldo abbraccio, Andrea

No, questo contenuto è riservato.
Non ci puoi accedere

E’ destinato a una ristretta lista di persone motivate e intraprendenti.

E’ diritto esclusivo di sognatori e curiosi.

Come? Pensi di essere una di loro?

Dimostramelo…

accetto i noiosi termini e le condizioni

Written by Andrea Provino - Novembre 18, 2019
Tags | consigli, data scientist, guida, portfolio project

You Might Also Like

tensorflow-wallpaper-machine-learning-data-science-deep-learning-tensorflow-guida-italiano-primi-passi-con-tesnorflow-italia

Tensorflow Guida Italiano: primi passi con Tensorflow

Aprile 2, 2020

Stripe: Semplice Form Pagamento React (client) | Guida Italiano

Ottobre 12, 2019
primi-passi-con-streamlit-guida-machine-learning-deployment-italian

Primi passi con streamlit: Il Machine Learning Deployment rapido!

Giugno 4, 2020
Next Post
Previous Post

Una pubblicità che non vedi se usi AdBlock

EXPAND YOUR KNOWLEDGE

  • rust-react-webassembly-privacy-preserving-machine-learning Logs

    Rust, WebAssembly, React e un MVP

    Dicembre 21, 2020
  • diffie-hellman-key-exchange-protocol-scambio-di-chiavi-diffie-hellman Data Science, Privacy Preserving

    Cos’è lo scambio di chiavi Diffie-Hellman (DH)? | Privacy Preserving

    Dicembre 15, 2020
  • principio-di-esattezza-data-science-machine-learning-gdpr-data-accuracy Data Science, GDPR Compliant

    GDPR: Principio di esattezza dei dati (Data Accuracy)

    Dicembre 12, 2020
  • tensorflow-extended-tfx-deploy-machine-learning-guide-machine-learning-pipelines machine-learning

    TFX: come funziona Tensorflow Extended?

    Dicembre 9, 2020
  • tensorflow-extended-tfx-deploy-machine-learning-guide-machine-learning-pipelines machine-learning

    TensorFlow Extended (TFX) | Production Machine Learning Pipeline

    Dicembre 6, 2020
  • mean-shift-clustering-guida-italiano-spiegazione-semplice-algoritmo-di-clustering-esempio Data Science

    Mean-Shift Clustering

    Dicembre 3, 2020
  • data-minimization-principle-gdpr-principio-minimizzazione-dati-personali-gdpr-italia-consulenza-spiegazione-semplice Data Science, GDPR Compliant

    GDPR: Principio di minimizzazione dei dati (Data minimization)

    Dicembre 1, 2020
  • machine-learning-for-finance-trading-online-data-science-deep-learning-intelligenza-artificiale AI, machine-learning

    FinTech: Machine Learning for Finance (FinML) | Guide e Risorse di qualità

    Novembre 29, 2020
  • gdpr-principio-di-limitazione-della-finalita-machine-learning-data-science-guida-prupose-limitation-gdpr Data Science, GDPR Compliant

    GDPR: Principio di Limitazione della finalità | Purpose Limitation

    Novembre 26, 2020
  • machine-learning-engineer-lavoro-stipendio-responsabilità-come-diventare AI, Business, machine-learning

    Machine Learning Engineer

    Novembre 23, 2020

Quello che Google pensa ti possa piacere

Prodotti che i Cookie dicono potresti trovare interessanti

AI Blog - © 2019-2021 Andrea Provino