Blog.

PyDP: Python Differential Privacy | Italiano


Autore
Andrea Provino
Data
Tempo di lettura
2 minuti
Categoria
Data Science, machine-learning, Privacy Preserving

python-differential-privacy-machine-learning-data-science-analytics-federated-learning-homorphic-encryption

PyDP (Python Differential Privacy) è una libreria open source per Privacy Preserving AI e Data Science, sviluppata dalla community di OpenMined.

Ammettiamolo: tu e io siamo persone pragmatiche.

Bella la teoria, il lieto studio, e le preziose definizioni da condividere con amici sorseggiando un Negroni a Monte Carlo.

Per inciso, non ci sono mai stato a Monte Carlo, ma l’obiettivo è chiaro.

Le parole da sole non bastano e per realizzare un prodotto abbiamo bisogno di nozioni operative.

Sappiamo bene cosa sia la Differential Privacy: ora è arrivato il momento di passare all’azione, mettendo in pratica i concetti appresi.

Procediamo.

PyDP: Python Differential Privacy

Oggi, in un approccio data-driven, data scientist e ricercatori sfruttano il machine learning per creare modelli e soluzioni innovative.

Prestiamo attenzione a una cosa.

Algoritmi sofisticati e potenza di calcolo facilmente disponibile hanno orientato il focus ai dati, la cui qualità incide direttamente sull’efficacia del modello in termini di accuratezza predittiva.

Esiste però un problema.

Questi modelli spesso si basano su dati sensibili o privati, di norma tutelati dalla legge, rendendone complessa la realizzazione e aumentando il rischio di privacy leakage.

La soluzione concreta si chiama PyDP (Python Differential Privacy).

Vediamo come possa aiutarci a compiere la nostra missione.

Specifiche

La libreria contiene un insieme di algoritmi definiti ε-differentially private algorithms, dove il parametro positivo ε (epsilon) esprime il compromesso tra privacy e utilità (i.e. Accuratezza), argomento trattato in questo post e che potresti aver perso.

Semplicemente, con un alto valore di ε preserviamo l’accuratezza a discapito della privacy, e otteniamo un esito contrario per valori bassi di ε.

Realizzata wrappando (ossia avvolgendo, concedimi l’inglesismo) la libreria di Differential Pivacy realizzata da Google, Python Differential Privacy presenta, al momento, le seguenti caratteristiche salienti:

  • Algoritmi supportati: BoundedMean, BoundedSum, Max, Count, Above, Percentile, Min, Median, etc. Per il momento questi algoritmi fanno uso del solo Laplace noise, anche se presto saranno aggiunte altre tipologie di rumore.
  • Supporto a Linux e macOS (Windows in arrivo)
  • Python 3.x

Qualora fossi in cerca di maggiori dettagli, e in attesa di qualche applicazione pratica, ti esorto a consultare la libreria Python Differential Privacy direttamente su GitHub.

Per il momento è tutto.

Per aspera, ad astra.

Un caldo abbraccio, Andrea.

Taggeddifferential privacygithubprivacy preserving machine learningpython


Ultimi post

Patricia Merkle Trie

Il Practical Algorithm To Retrieve Information Coded In Alphanumeric Merkle Trie, o Patricia Merkle Trie è una struttura dati chiave-valore usatada Ethereum e particolarmente efficiente per il salvataggio e la verifica dell’integrità dell’informazione. In questo post ne studieremo le caratteristiche. Prima di procedere, ci conviene ripassare l’introduzione al Merkle Tree nella quale abbiamo chiarito il […]

Andrea Provino
ethereum-patricia-merkle-tree
Tree Data Structure: cos’è un Merkle Tree

Un Merkle Tree è una struttura dati efficiente per verificare che un dato appartenga a un insieme esteso di elementi. È comunemente impiegato nelle Peer to Peer network in cui la generazione efficiente di prove (proof) contribuisce alla scalabilità della rete. Capire i vantaggi di questa struttura ci tornerà utile nel nostro percorso di esplorazione […]

Andrea Provino
merkle-tree-cover
UTXO: come funziona il modello Unspent Transaction Outputs

Per tenere traccia dei bilanci utente, la blockchain di Bitcoin sfrutta un modello di contabilità definito UTXO o Unspent Transaction Outputs. In questo articolo ne esaminiamo le caratteristiche. Ogni blockchain è dotata di un sistema di contabilità, un meccanismo attraverso cui tenere traccia dei bilanci di ciascun utente. I due grandi modelli di riferimento nel […]

Andrea Provino
bitcoin-utxo
Cos’è Ethereum

Possiamo definire Ethereum come una macchina a stati distribuita che traccia le transizioni di un archivio dati general-purpose (i.e. una memoria in grado di registrare qualsiasi dato esprimibile come coppia di chiave e valore o key-value) all’interno della Ethereum Blockchain. È arrivato il momento di esplorare uno dei progetti tecnologici più innovativi e interessanti degli […]

Andrea Provino
ethereum