Cos’è il Test chi quadrato? Il Test chi quadrato è un test di verifica d’ipotesi, che usa la distribuzione chi…
Qual è la definizione del GDPR per l’elaborazione dati (Data Processing) ? Comprenderla ci aiuta a condurre analisi evitando costose…
Con l’espressione Synthetic Data soliamo riferirci ai dati sintetici generati da una sistema, una macchina. Una definizione semplice, ma che…
Gestendo dataset di grandi dimensioni abbiamo due alternative da valutare: Scaling up e Scaling out. Il nostro obiettivo è fare…
Data Science, machine-learning, Privacy Preserving
Non-IID ness: Non-independently and identically distributed data
La Non-IID ness è un’espressione usata in modo ampio per indicare il complesso di metodologie, algoritmi e approcci per rappresentare,…
Con l’espressione Privacy Preserving Data Mining intendiamo quell’insieme di attività, e tecniche, con le quali estrarre informazioni garantendo la privacy…
La privacy è un fattore cruciale da tenere a mente nello sviluppo di nuovi sistemi e applicazioni. In questi giorni…
Le serie temporali, o storiche (time-series data) sono sequenze di valori ordinati nel tempo e contrassegnati da un momento storico.…
Elastic Net è una versione regolarizzata della Linear Regression (Regressione Lineare), una via di mezzo tra Ridge Regression e Lasso…
Folium è una python data visualization library creata con l’intento di aiutarci nella visualizzazione di geospatial data, i dati geospaziali.…