• 🏡 Home
  • 🚨 GDPR Compliant
  • ⚡️ Data Science
  • 📌 Machine Learning
  • 🔒 Privacy Preserving
  • 🏡 Home
  • 🚨 GDPR Compliant
  • ⚡️ Data Science
  • 📌 Machine Learning
  • 🔒 Privacy Preserving
Data Science, machine-learning

Project Planning Funnel | Machine Learning Portfolio Projects

Project Planning Funnel | Machine Learning Portfolio Projects

L’obiettivo di oggi è definire il Project Planning Funnel, ossia il percorso ideale (letteralmente l’imbuto) per pianificare i tuoi progetti da inserire nel porfolio da Data Scientist.

Inziamo dalle basi.

Prima una ripassata al concetto di Machine Learning.

Ora che abbiamo le idee chiare. Passiamo al funnel

Project Planning Funnel | Cos’è?

Il project planning funnel è una serie di step chiave, che rappresentanto delle guide lines per pianificare in modo ordinato e sequenziale la fasi preliminari di ogni progetto che andremo a realizzare.

E’ quindi una best practice da seguire per strutturare omogeneamente ciascun portfolio project.

Sono 5 step:

  • Domain
  • Topic
  • Datasets
  • ML Task
  • Win Condition

Domain Knownledge

Il primo obiettivo è individuare un dominio di interesse. Ad esempio l’E-commerce, o l’immobiliare, e ancora la biologia o il settore automotive.

I risultati migliori si ottengono quando competrenze personali in un dato dominio sono fuse con le tecniche di data analysis.

Questo perché conoscenze altamente verticali fanno la differenza nel processo più delicato del machine learning in ambito data science: feature engineering.

Topic | Find your challenges

Individuato il dominio, occore trovare delle sfide, o problemi, che si vuole superare.

E’ bene fare un minimo di brain storming e focalizzare l’attenzione su almeno 3 topics.

Il punto è capire quali soluzioni un sistema di machine learning potrebbe trovare a problemi complessi o per cui non esiste oggi un dato algoritmo.

Chi beneficerebbe maggiormente grazie a queste soluzioni?

Cosa renderebbe felice il nostro stakeholder?

Un esempio, considerando il settore automotive:

  • prevedere il costo di un auto elettrica
  • prevedere quando l’auto deve andare dal meccanico
  • individuare i cluster di automobilisti in Italia

Datasets | Find Yoour Data

Scelto il dominio, e individuati i problemi che intendiamo risolvere, inizia la ricerca dei dati.

Dobbiamo prestare attenzione alla ricchezza delle features, e alla loro qualità: numero sufficiente di osservazioni e presenza della variabile target.

Ricorda che è fondamentale avere dati di buona qualità.

Se non dovessimo trovare dati di nostro interesse, torniamo indietro e facciamo nuovi brain stroming.

Il Project Planning Funnel è un processo iterativo.

ML Task | Confirm Machine Learning Task

Da bravi Data Scientist con una mente ordinata e schematica: confermiamo il task di machine learning che intendiamo portare a termine:

  • classificazione
  • regressione
  • clustering

Poiché l’obiettivo è generare dei progetti utili da inserire nel nostro portfolio, sono i dati che ci guidano.

Ad esempio, se il nostro dataset contiene una label discreta, il sistema di machine learning sarà di classification learning.

Win Condition | When you project should end

E’ mandatorio definire una win condition.

Si tratta di una condizione fissata a priori, anche in modo generico, per determinare la fine del progetto.

E’ importante poiché in sua assenza potremmo procedere ad oltranza senza un chiaro obiettivo in testa… no buono!

Una win condition può essere:

  • quantitativa, performare al di sotto di un certo errore
  • temporale, lavorare al progetto per due settimane sviluppando il miglior modello possibile.

Questi sono i più importanti punti da tenere a mente per iniziare con successo il progetto da inserire nel portfolio personale.

Un caldo abbraccio, Andrea.

Written by Andrea Provino - Settembre 11, 2019
Tags | machine learning

You Might Also Like

recommender-systems-memory-based-model-based-content-based-collective-filtering-machine-learning-data-science-blog

Recommender Systems

Novembre 14, 2019
clustering-tutto-quello-che-devi-sapere-clustering-data-science-machine-learning-guida-italiano

Clustering: tutto quello che devi sapere | Edizione 2021

Novembre 15, 2020
lasso-regression-least-absolute-shirnkage-and-selection-operator-data-science-machine-learning-guida-italiano-ridge-regression-elasticnet-lasso-regression-python

LASSO Regression | Italiano

Dicembre 4, 2019
Next Post
Previous Post

Una pubblicità che non vedi se usi AdBlock

EXPAND YOUR KNOWLEDGE

  • Blockchain Developer

    Circuito aritmetico

    Novembre 1, 2022
  • machine-learning

    Un nuovo inizio

    Settembre 4, 2021
  • Zero Knwoledge Proof Article Privacy Preserving

    Zero Knowledge Proof: zk-SNARK e zk-STARK | Prova a conoscenza zero

    Luglio 8, 2021
  • oblivious-transfer-spiegazione-italiano-ot-explanation Privacy Preserving

    Oblivious Transfer (OT)

    Luglio 6, 2021
  • Aleo Studio Website Preview machine-learning

    Aleo Studio: un IDE per Zero-Knowledge Proofs Applications

    Luglio 1, 2021
  • privacy-enhancing-technologies-data-machine-learning-data-science Privacy Preserving

    Perché il Privacy Tech è un vantaggio competitivo micidiale

    Giugno 17, 2021
  • bloom-filter-spiegazione-italian Privacy Preserving

    Bloom Filter

    Giugno 3, 2021
  • trusted-execution-environment-tee-data-science-come-fuziona Data Science, Privacy Preserving

    Trusted Execution Environment | Cos’è un TEE?

    Giugno 2, 2021
  • Crypto Custody services machine-learning

    Crypto Custody: Guida alla custodia delle criptomonete

    Maggio 26, 2021
  • deep-q-learning-q-learning-reinforcement-learning machine-learning

    Deep Q-Learning

    Aprile 27, 2021

Quello che Google pensa ti possa piacere

Prodotti che i Cookie dicono potresti trovare interessanti

AI Blog - © 2019-2021 Andrea Provino