Fine siesta: data scientist? Ancora tanto da fare. Partiamo!

Autore

Andrea Provino

Data

7 febbraio 2019

Tempo di lettura

3 minuti

Categoria

Logs

Buongiorno!

Oggi cambiano un po’ di cose!

Posizione più scomoda non potevo trovarla.

Il contesto

Mi trovo a bordo di un treno direzione Milano. Oggi, sarà il mio primo giorno di lavoro; ma questa è un’altra storia.

Il problema è che il computer, spesso quanto un foglio di carta e realizzato in lamiera particolarmente propense alle curvature è posto a metà strada tra un porta biccchieri e il bordo del tavolo.

In pratica, tra 50 minuti quando arriverò a Milano, mi troverò un banana PC.

Passiamo al motivo di questo post.

Ricominciamo

Dal 10 gennaio le cose sul sito si sono bloccate. Stavamo conducendo l’EDA sul Big Mart Sales dataset, e quello potrebbe essere un ottimo punto di partenza per riprendere le redini del progetto.

Dobbiamo tuttavia tenere anche a mente che, ad oggi, non abbiamo un programma a lungo termine per:

il sito;
il percorso da aspiranti data scientist.

E questo non va bene…

Mi sono fermato un attimo per riflettere. Ecco la conclusione a cui sono giunto.

Le conclusioni

questo post è incredibilmente breve, e non sarà mai indicizzato da Google.
il mio computer sta diventando un bananone dal display curvo. It’s a feature
prima di iniziare un nuovo progetto, dobbiamo finire quelli aperti. Quindi? riprendiamo l’articolo sul Big Mart e cominciamo.

Dunque, risolviamo il primo e l’ultimo punto in un unico articolo!

Big Mart Dataset: cosa facciamo?

Ci siamo lasciati con questo articolo, che fornisce una panoramica generale delle informazioni emerse dall’EDA, delle domande sorte e alcune prime ipotesi generate nel tentativo di spiegare anomalie e alimentare il ciclo iterativo proprio dell’Exploratory Data Analysis.

Ora però mi trovo davanti un problema che ti illustro rapidamente.

Quello che faccio in questi post e spiegarti sostanzialmente il mio personale approcio a diversi problemi nel tentativo di trovare una soluzione da condividere con te. Sono però il primo ad ammettere che non so nulla di machine learning e tecniche di data science.

Ecco perché le mie primarie fonti di apprendimento sono siti specializzati alle cui spalle spero ci sia qualcuno che ne capisca più di me. Ed ecco il punto.

Ho iniziato questo progetto seguendo una semi-guida che spiegava come procedere usando R. Ora ne ho trovata una migliore e più dettagliata che usa Python. Quindi… o procediamo seguendo la nuova guida rielaborando i contenuti in modo tale che il progetto sia compatibile con R, oppure passiamo a python perché in fondo quello che abbiamo fatto fin’ora è limitarci a condurre l’EDA.

Nel dubbio? Facciamo tutti e due!

Questo è stato un post riepilogativo che mi ha permesso di chiarire un attimo la strada da percorrere nei prossimo giorni. Dal post successivo le cose si fanno serie! Si torna al lavoro. Zaino in spalla. La vetta è alta!

Alla prossima!

Un caldo abbraccio, Andrea

Blog.

Fine siesta: data scientist? Ancora tanto da fare. Partiamo!

Il contesto

Ricominciamo

Le conclusioni

Big Mart Dataset: cosa facciamo?

Ultimi post