• 🏡 Home
  • 🚨 GDPR Compliant
  • ⚡️ Data Science
  • 📌 Machine Learning
  • 🔒 Privacy Preserving
  • 🏡 Home
  • 🚨 GDPR Compliant
  • ⚡️ Data Science
  • 📌 Machine Learning
  • 🔒 Privacy Preserving
Data Science, Privacy Preserving

Direct vs Indirect Identifiers

Direct vs Indirect Identifiers

La differenza tra Direct vs Indirect Identifiers è fondamentale per educarci alla privacy dei nostri dati personali.

Questo post è il naturale proseguimento di quello inerente alla differenza tra anonymization e preudonymization.

Lo trovi qui.

Cominciamo!

Direct vs Indirect Identifiers | Definizioni

Quando si parla di privacy la prima cosa che ci viene in mente è violazione dei dati, i nostri amati dati personali.

Serve un po’ di chiarezza.

La violazione della privacy è spesso associata limitatamente alla pubblicazione o divulgazione di dati privati quali nome, cognome, indirizzo di residenza, numero di telefono, o codice fiscale.

In realtà il problema è molto più ampio.

Facciamo un passo indietro.

Prima di parlare di violazione dei dati, dobbiamo chiarire cosa siano i dati privati o personali e come distinguerli.

Per il momento, evitiamo di considerare le rigorose definizioni del GDPR e limitiamoci alle differenze esistenti tra Direct vs Indirect Identifiers.

Direct Identifiers

Gli identificatori diretti sono i classici dati personali quali nome, cognome, codice fiscale e simili.

In un processo di anonimizzazione, questi dati possono facilmente essere rimossi, offuscati e sostituiti con dati casuali.

Il problema reale nella tutela della privacy dal punto di vista di un’azienda è legata ai così detti identificatori indiretti.

Indirect Identifiers

Consideriamo alcune informazioni apparentemente irrilevanti.

Informazioni come il tuo tragitto giornaliero casa – ufficio, che unite al modello dello smartphone, e quello dell’auto, che hai inserito in un’applicazione per il traffico, possono identificarti da altri utenti.

Questi dati sono definiti identificatori indiretti, o indirect identifiers.

Si tratta di tutte quelle informazioni che, prese singolarmente, non consentirebbero alcuna inferenza, ma che combinate tra loro permettono di distinguere più soggetti tra loro.

A un livello macroscopico, gli indirect identifiers sono le connessioni sociali, lo storico medico e la lingua parlata, con le quali è possibile distinguere gruppi limitati di persone.

Il problema è reale poiché gli identificatori non sono facili da individuare in un dataset

Supponendo che io sia un’azienda intenta a pubblicare alcune informazioni.

Come faccio a sapere quante di queste possano essere rilasciate in sicurezza perché non compromettono la privacy dei soggetti, non consentendone l’identificazione?

Come abbiamo detto, gli identificatori indiretti presi singolarmente sono inutili, sebbene alcuni di loro possano essere usati per de-anonimizzare un dataset.

Qui puoi trovare maggiori info.

Per il momento è tutto.

Per aspera, ad astra.

Un caldo abbraccio, Andrea.

Written by Andrea Provino - Settembre 28, 2020
Tags | data science, privacy

You Might Also Like

privacy-vs-utility-tradeoff-deep-learning-machine-learning-blog-italia-privacy-preserving-ai

Privacy vs Utility Trade-off

Maggio 4, 2020

Overplotting: cos’è e come porvi rimedio | Towards Data Science

Gennaio 7, 2019
precision-and-recall-precision-recupero-trade-off-data-science-machine-learning-spiegazione-semplice-italiano-precisione-recupero

Precision and Recall con F1 Score | Precisione e Recupero

Settembre 28, 2019
Next Post
Previous Post

Una pubblicità che non vedi se usi AdBlock

EXPAND YOUR KNOWLEDGE

  • Blockchain Developer

    Circuito aritmetico

    Novembre 1, 2022
  • machine-learning

    Un nuovo inizio

    Settembre 4, 2021
  • Zero Knwoledge Proof Article Privacy Preserving

    Zero Knowledge Proof: zk-SNARK e zk-STARK | Prova a conoscenza zero

    Luglio 8, 2021
  • oblivious-transfer-spiegazione-italiano-ot-explanation Privacy Preserving

    Oblivious Transfer (OT)

    Luglio 6, 2021
  • Aleo Studio Website Preview machine-learning

    Aleo Studio: un IDE per Zero-Knowledge Proofs Applications

    Luglio 1, 2021
  • privacy-enhancing-technologies-data-machine-learning-data-science Privacy Preserving

    Perché il Privacy Tech è un vantaggio competitivo micidiale

    Giugno 17, 2021
  • bloom-filter-spiegazione-italian Privacy Preserving

    Bloom Filter

    Giugno 3, 2021
  • trusted-execution-environment-tee-data-science-come-fuziona Data Science, Privacy Preserving

    Trusted Execution Environment | Cos’è un TEE?

    Giugno 2, 2021
  • Crypto Custody services machine-learning

    Crypto Custody: Guida alla custodia delle criptomonete

    Maggio 26, 2021
  • deep-q-learning-q-learning-reinforcement-learning machine-learning

    Deep Q-Learning

    Aprile 27, 2021

Quello che Google pensa ti possa piacere

Prodotti che i Cookie dicono potresti trovare interessanti

AI Blog - © 2019-2021 Andrea Provino