PyDP (Python Differential Privacy) è una libreria open source per Privacy Preserving AI e Data Science, sviluppata dalla community di OpenMined.
Ammettiamolo: tu e io siamo persone pragmatiche.
Bella la teoria, il lieto studio, e le preziose definizioni da condividere con amici sorseggiando un Negroni a Monte Carlo.
Per inciso, non ci sono mai stato a Monte Carlo, ma l’obiettivo è chiaro.
Le parole da sole non bastano e per realizzare un prodotto abbiamo bisogno di nozioni operative.
Sappiamo bene cosa sia la Differential Privacy: ora è arrivato il momento di passare all’azione, mettendo in pratica i concetti appresi.
Procediamo.
PyDP: Python Differential Privacy
Oggi, in un approccio data-driven, data scientist e ricercatori sfruttano il machine learning per creare modelli e soluzioni innovative.
Prestiamo attenzione a una cosa.
Algoritmi sofisticati e potenza di calcolo facilmente disponibile hanno orientato il focus ai dati, la cui qualità incide direttamente sull’efficacia del modello in termini di accuratezza predittiva.
Esiste però un problema.
Questi modelli spesso si basano su dati sensibili o privati, di norma tutelati dalla legge, rendendone complessa la realizzazione e aumentando il rischio di privacy leakage.
La soluzione concreta si chiama PyDP (Python Differential Privacy).
Vediamo come possa aiutarci a compiere la nostra missione.
Specifiche
La libreria contiene un insieme di algoritmi definiti ε-differentially private algorithms, dove il parametro positivo ε (epsilon) esprime il compromesso tra privacy e utilità (i.e. Accuratezza), argomento trattato in questo post e che potresti aver perso.
Semplicemente, con un alto valore di ε preserviamo l’accuratezza a discapito della privacy, e otteniamo un esito contrario per valori bassi di ε.
Realizzata wrappando (ossia avvolgendo, concedimi l’inglesismo) la libreria di Differential Pivacy realizzata da Google, Python Differential Privacy presenta, al momento, le seguenti caratteristiche salienti:
- Algoritmi supportati: BoundedMean, BoundedSum, Max, Count, Above, Percentile, Min, Median, etc. Per il momento questi algoritmi fanno uso del solo Laplace noise, anche se presto saranno aggiunte altre tipologie di rumore.
- Supporto a Linux e macOS (Windows in arrivo)
- Python 3.x
Qualora fossi in cerca di maggiori dettagli, e in attesa di qualche applicazione pratica, ti esorto a consultare la libreria Python Differential Privacy direttamente su GitHub.
Per il momento è tutto.
Per aspera, ad astra.
Un caldo abbraccio, Andrea.
No Comment