Blog.

Airbnb: il profilo del Data Scientist | Domande colloquio di lavoro


Autore
Andrea Provino
Data
Tempo di lettura
5 minuti
Categoria
Data Science, machine-learning

airbnb-data-scientist-job-interview-questions-data-science-machine-learning-colloquio-di-lavoro-domande-airbnb-data-science

Come funziona un colloquio di lavoro presso Airbnb per una posizione di Data Scientist?

A spiegarcelo è Jay Feng, fondatore di Inteview Query, un aggregatone di domande raccolte durante i colloqui di lavoro presso alcune Top Companies americane: Airbnb, Microsoft, Dropbox, Lyft e Twitch

Puoi trovare l’articolo originale su Medium, qui lo interpreteremo a modo nostro.

I dati secondo Airbnb

Data is the voice of the customer and data science is the interpretation of the voice

A matter of data

Fantastica definizione, certamente da usare in qualche presentazione.

Veniamo al dunque.

L’alto valore del servizio prodotto dipende in parte dall’ottimo team di data science che sono riusciti a creare nel corso degli anni.

Il tipico Data Scientist è responsabile di:

  • Organizzare i dati e crare delle ETL piepelines (Extracting, Transforming and Loading)
  • Analizzare, processare e visualizzare dati in informazioni utili
  • Applicare la Data Science per produrre valore

Queste sono a grandi linee le mansioni generiche.

Dov’è la ciccia?

Con calma con calma.

Ruoli da Data Scentist

Come spesso accade nelle grandi compagnie americane, i ruoli professionali sono distinti in categorie denominate tier.

Qui ne distinguiamo tre: analytics, inference and algorithms

Analytics 

Ti fai molte domande? Questa è la posizione per te!

Per entrare in questa categoria devi essere particolarmente orientato ai dettagli e con un fiero carattere da inquisitore, capace di osservare con sguardo critico i dati e trarne le migliori conclusioni per orientare efficacemente le decisioni che il business richiede.

Una posizione simile a quelle aperte, sempre come data scientist, da Facebook e Linkedin.

Inference

Quale problema dobbiamo risolvere?

È la principale domanda da porci.

Poi passiamo ad analizzare i dati e trovare una risposta valida.

Come sempre, visualizzazione dei dati e statistica sono le nostre affilate armi.

Questa categoria, rispetto alle altre, richiede particolari conoscenze di economia e statistica, con un background PhD (il dottorato di ricerca)

Algorithms

Datemi una tastiera, inizio a programmare.

I linguaggi di programmazione possono variare, ma occorre saper creare modelli e soprattutto rilasciarli in produzione.

In pratica devono funzionare, e funzionare bene.

Niente semplice Jupyter Notebook o un Google Colab Online.

I problemi rientrano nell’ambito della raccomandazione e matching per utenti.

In conclusione, una posizione simile a quella di un machine learning engineer.

Il colloquio di lavoro

Un classico colloquio di lavoro presso Aribnb è articolato in tre fasi.

Phone Screening

Il telefono suona. È il recruiter.

Il nostro curriculum è stato esaminato per capire quanto siamo qualificati.

Iniziano le domande.

Qualche giorno prima abbiamo appreso il più possibile riguardo l’azienda. Meno male!

Airbnb tiene molto alla conoscenza che un candidato ha dell’azienda, della filosofia di lavoro e dei prodotti distribuiti.

Noi ci siamo preparati in dolce progetto che potremmo realizzare se solo venissimo assunti, e lo piazziamo proprio lì sul tavolo.

Data Science Take-Home Challenge

Abbiamo superato la prima fase.

Ora inizia la seconda: una challenge.

Abbiamo 24 ore, per altri progetti ne avremmo avuti 48.

Dobbiamo fare un’analisi dati. Partiamo dal dataset, lo analizziamo e produciamo una presentazione in powerpoint.

La posizione da data scientist algorithms prevede invece la risoluzione di un problema in sole 3 ore.

A partire da alcuni test preliminari sui dati, dobbiamo procedere rapidamente alla creazione di un modello giustificando le nostre scelte.

On-site Interview and presentation

Finalmente.

Entriamo negli uffici di Aribnb: ci aspetta il colloquio di persona.

Questa è la fase più imponente.

Entriamo in contatto con il team, e ci viene spiegato cosa significhi lavorare in azienda come data scientist.

Un ultimo task, per metterci ulteriormente alla prova.

Si tratta di un problema reale, con una domanda aperta che attende una risposta.

Spetta a noi organizzare i dati, sviluppare una strategia e spiegare al team come potrebbe essere loro utile.

Abbiamo 7 ore, scadute le quali dobbiamo presentare il nostro lavoro a un board di giudici interni.

Passiamo anche questa fase, ma non è finita.

Ora inizia l’ultimo sprint.

5 colloqui 1to1 che testano ulteriormente le competenze di coding ed effettuano un’analisi comportamentale.

Veniamo al duqnue… quali potrebbero essere le domande?

Domande colloquio di lavoro data scientist

Queste sono alcune delle domande che potrebbero chiederci, ovviamente in inglese.

  • Progetta un sistema di raccomandazione
  • Quali tabelle e indici avresti bisogno in un Sql Database per gestire chat threads?
  • Come valuteresti l’efficacia del tuo operations team?
  • Ieri le visualizzazioni sono calate. Come investigheresti sul problema?
  • Come spiegheresti p-value a un business man?
  • Al termine di un AB Test il product manager torna con un p-value di 0.04. Come valuti la validità del risultato?
  • Date due tabelle, una contenente profili utenti e interessi, l’altra case da consigliare, con tanto di topic tags e metadata come servizi, prezzo, recensioni, posizione, paese, argomento e altro. Crea un sistema di raccomandazione usando questi dati.
  • Implementa il K-means e KNN

Some tips

Riassumiamo quindi i punti fondamentali.

Dobbiamo dimostrare la nostra morbosa ossessione per l’azienda, leggere articoli, studiarne i prodotti, e conoscerne storia, valori e cultura.

Il nostro portfolio deve comprendere nozioni base dei principali algoritmi di machine learning:

A completare il nostro profilo ci pensano anche nozioni base di matematica e statistica / probabilità.

Prepariamoci a difendere il nostro curriculum, aspettandoci domande fuorvianti e apparentemente strane: dovranno testare le nostre performance.

Un caldo abbraccio, Andrea.

Taggeddata sciencedata scientistmachine learningportfolio project


Ultimi post

Patricia Merkle Trie

Il Practical Algorithm To Retrieve Information Coded In Alphanumeric Merkle Trie, o Patricia Merkle Trie è una struttura dati chiave-valore usatada Ethereum e particolarmente efficiente per il salvataggio e la verifica dell’integrità dell’informazione. In questo post ne studieremo le caratteristiche. Prima di procedere, ci conviene ripassare l’introduzione al Merkle Tree nella quale abbiamo chiarito il […]

Andrea Provino
ethereum-patricia-merkle-tree
Tree Data Structure: cos’è un Merkle Tree

Un Merkle Tree è una struttura dati efficiente per verificare che un dato appartenga a un insieme esteso di elementi. È comunemente impiegato nelle Peer to Peer network in cui la generazione efficiente di prove (proof) contribuisce alla scalabilità della rete. Capire i vantaggi di questa struttura ci tornerà utile nel nostro percorso di esplorazione […]

Andrea Provino
merkle-tree-cover
UTXO: come funziona il modello Unspent Transaction Outputs

Per tenere traccia dei bilanci utente, la blockchain di Bitcoin sfrutta un modello di contabilità definito UTXO o Unspent Transaction Outputs. In questo articolo ne esaminiamo le caratteristiche. Ogni blockchain è dotata di un sistema di contabilità, un meccanismo attraverso cui tenere traccia dei bilanci di ciascun utente. I due grandi modelli di riferimento nel […]

Andrea Provino
bitcoin-utxo
Cos’è Ethereum

Possiamo definire Ethereum come una macchina a stati distribuita che traccia le transizioni di un archivio dati general-purpose (i.e. una memoria in grado di registrare qualsiasi dato esprimibile come coppia di chiave e valore o key-value) all’interno della Ethereum Blockchain. È arrivato il momento di esplorare uno dei progetti tecnologici più innovativi e interessanti degli […]

Andrea Provino
ethereum