Blog.

Coursera IBM Data Science: Online Course Review | Italiano


Autore
Andrea Provino
Data
Tempo di lettura
6 minuti
Categoria
AI, Data Science, machine-learning

ibm-data-science-professional-certificate-coursera-machine-learning-massive-online-open-courses-mooc

IBM Data Science Professional Certificate è un corso online distribuito da Coursera, una popolare piattaforma per i così detti MOOC (Massive Online Open Courses).

Ho impiegato due mesi per ottenere quel tanto scintillante certificato che ora osteggio ai quattro venti.

Una persona superficiale penserebbe che mi stia vantando.

Io e te, siamo persone profonde, attente e analitiche.

Sappiamo che per diventare bravi data scientist sia necessario sviluppare anche le soft skill, e tra queste l’umiltà è certamente presente.

Allora ecco il perché di questo articolo: condividere con te i pro e contro del corso, dandoti un parere personale.

Penso che un consiglio da un caro amico sia sempre ben accetto, non trovi?

Coursera IBM Data Science

Il 18 settembre 2019, dopo innumerevoli pensieri a riguardo, spinto forse dalla possibilità di provare per 7 giorni il corso in modo gratuito, mi decisi ad iscrivermi.

Subscribed

Inizia il viaggio.

IBM Data Science è un corso entry-level, composto da 9 aree tematiche, ciascuna suddivisa in un numero variabile di moduli.

Quasi ogni modulo ha un quiz, che è necessario superare studiando il materiale fornito sotto forma di video, ciascuno corredato da una trascrizione noiosa e di difficile lettura, o un jupyter notebook interattivo e collegato a niente popò di meno che a un piattaforma denominata IBM Watson Studio.

Bella sponsorizzazione dei propri servizi.

Le aree tematiche del corso di IBM Data Science sono reperibili al seguente link.

Tralasciando le classiche “What is Data Science?” e “Machine Learning with Python”, noi intendiamo sapere dove risiede la ciccia!

Passiamo allora ai pareri personali!

Coursera Platform Organization Review

Ora, potrei ferire qualche compagno e collega, classmate, sottovalutando le sue competenze.

Tenendo però presente la natura introduttiva del corso, e avendo valutato con occhi oggettivi la piattaforma mi sento abbastanza sicuro di affermare due cose.

Non ci sarà alcun data scientist a valutare il tuo lavoro.

Non ci sarà alcun esperto che correggerà i tuoi quiz.

I quiz sono corretti automaticamente e in modo sistematico dal computer, con feedback previsti in caso di risposta errata.

Il numero di domande è variabile, la maggior parte è a scelta multipla.

Compili il modulo, e invi le tue risposte.

Hai 3 tentativi ogni 8 ore per raggiungere la sufficienza (60% o 80% di risposte corrette).

Quindi se sbagli… Ritenti fin quando non passi l’ “esame”.

È praticamente impossibile essere respinto: con un minimo di logica, intelligenza e un pizzico di memoria a breve termine chiunque sarebbe in grado di passare i test, anche avendo studiato poco o nulla.

Ad accompagnare i quiz, per i corsi tematici di livello intermedio, ci sono alcuni progetti da realizzare: costituiscono la parte pratica del corso.

Ripeto non ci sarà alcun data scientist a valutare il tuo progetto.

Ti spiego perché penso questo.

Per passare un’area tematica, e ottenerne la relativa certificazione (collezionate le quali potrai avere l’attestato di fine corso), il tuo progetto deve essere valutato attraverso un sistema di peer-graded.

Questo metodo assicura la scalabilità dei corsi online, e rappresentano la base di funzionamento dei MOOC.

Immagini quante persone servirebbero per valutare 100, 1000, 10.000 progetti?

Ora estendi questo ragionamento a 10, 100 e 1000 corsi, quelli presenti su Coursera.

Come risolvi i problemi di scalabilità?

Rendi il sistema autosufficiente: fai correggere i compiti dagli altri studenti, rendendo obbligatoria la correzione di almeno 1, 2 o 3 progetti (a seconda dell’area tematica; anche se presumo dipenda dalla congestione delle classi virtuali).

Questo innesca ulteriori complicazioni quali il cold start, quando il numero di utenti è basso, che però ho idea vengano in parte risolti bloccando temporaneamente l’enrolling fino a raggiungimento di una soglia che consenta il funzionamento del sistema.

Ho corretto una trentina di progetti, e per quanto mi piaccia considerarmi tale, ho molta strada da fare prima di diventare un Data Scientist.

Insieme lo diventeremo. Trust me

Inizialmente cercavo di essere attento e scrupoloso, poi con l’aumentare della lunghezza dei progetti la correzione diventava superficiale.

Presumo che questo ragionamento possa essere esteso a molti come me, da cui l’opinione bassa nei confronti di questo sistema: scalabile, ma inefficace.

Passiamo alle considerazioni sul corso di IBM Data Science

IBM Data Science Course Content Review

A livello contenutistico ho poco da contestare. Ho parzialmente usato il materiale del corso come spunto per qualche articolo.

Il corso di IBM Data Science ha certamente contenuti validi e di qualità.

I video sono ben realizzati ed esplicativi, seppur frammentari.

I progetti sono perlopiù di analisi dati: visualizzazione, rappresentazione, interpretazione di grafici.

Ti insegnano l’uso dei tool base.

Partendo dai sistemi di visualizzazione convenzionali, passando a quelli più avanzati, raggiungi finalmente la parte di algoritmi e modelli.

Entri in contatto con modelli di Clustering, Regression e Classification, con qualche approfondimento sui Recommender Systems o i sistemi di clustering avanzati come il DBSCAN.

Tra l’altro, colgo l’occasione per dirti che abbiamo approfondito il concetto di clustering in un super articolo di 3k parole che unisce tutto quello che devi sapere sul clustering.

Alcuni progetti prevedono l’uso di servizi API esterni, come Foursquare che mette gratuitamente a disposizione insights riguardo punti d’interesse nelle città, con possibilità di sottoscrivere anche piani a pagamento.

Impari a fare web scraping, una tecnica che ti farò conoscere, nei prossimi post.

Conclusion: Overall Opinion on IBM Data Science Course

Al termine di questo corso avrai dei lavori da mostrare e alcuni certificati da esporre sul tuo profilo e con il quale potrai forse attirare l’attenzione di quale Recruiter.

Certamente IBM Data Science non è un corso sufficiente a definirti un professionista: dovrai integrare le informazioni in esso presenti con ricerche approfondite e aggiuntive.

Il motivo per cui ho cercato di essere quanto più dettagliato e approfondito possibile è perché difficilmente sono in grado di consigliarti a cuore aperto questo corso.

Per 35€ al mese, fino a conclusione del percorso, hai accesso a un buon corso introduttivo.

A mio avviso, sfrutta al massimo quei 7 giorni gratuiti.

Comprendi il funzionamento della piattaforma, capisci se l’organizzazione dei quiz e del materiale fornito sia di tuo gradimento e decidi finalmente se ultimare l’iscrizione.

Non riflettere troppo sui contenuti, perché se pensi si diventare un data scientist con un solo corso…

Troverai vita dura.

Mi sento come prima? Assolutamente no.

Il certificato aiuta a superare la sindrome dell’impostore, però penso che 2 mesi siano davvero pochi per completare un corso del genere.

Intendiamoci, sono due mesi d’impegno altalenante e frammentario. Sono consapevole di aver trattato alcuni argomenti in modo superficiale, ed è per questo che quel attestato vale per me davvero poco.

Ora diamo spazio ai progetti concreti. Inizia la sfida!

Seguimi!

Per il momento è tutto.

Per aspera, ad astra.

Un caldo abbraccio, Andrea

Taggedconsiglidata sciencedata scientist


Ultimi post

Patricia Merkle Trie

Il Practical Algorithm To Retrieve Information Coded In Alphanumeric Merkle Trie, o Patricia Merkle Trie è una struttura dati chiave-valore usatada Ethereum e particolarmente efficiente per il salvataggio e la verifica dell’integrità dell’informazione. In questo post ne studieremo le caratteristiche. Prima di procedere, ci conviene ripassare l’introduzione al Merkle Tree nella quale abbiamo chiarito il […]

Andrea Provino
ethereum-patricia-merkle-tree
Tree Data Structure: cos’è un Merkle Tree

Un Merkle Tree è una struttura dati efficiente per verificare che un dato appartenga a un insieme esteso di elementi. È comunemente impiegato nelle Peer to Peer network in cui la generazione efficiente di prove (proof) contribuisce alla scalabilità della rete. Capire i vantaggi di questa struttura ci tornerà utile nel nostro percorso di esplorazione […]

Andrea Provino
merkle-tree-cover
UTXO: come funziona il modello Unspent Transaction Outputs

Per tenere traccia dei bilanci utente, la blockchain di Bitcoin sfrutta un modello di contabilità definito UTXO o Unspent Transaction Outputs. In questo articolo ne esaminiamo le caratteristiche. Ogni blockchain è dotata di un sistema di contabilità, un meccanismo attraverso cui tenere traccia dei bilanci di ciascun utente. I due grandi modelli di riferimento nel […]

Andrea Provino
bitcoin-utxo
Cos’è Ethereum

Possiamo definire Ethereum come una macchina a stati distribuita che traccia le transizioni di un archivio dati general-purpose (i.e. una memoria in grado di registrare qualsiasi dato esprimibile come coppia di chiave e valore o key-value) all’interno della Ethereum Blockchain. È arrivato il momento di esplorare uno dei progetti tecnologici più innovativi e interessanti degli […]

Andrea Provino
ethereum