Blog.

DataFleets: AI Company | AI for Business


Autore
Andrea Provino
Data
Tempo di lettura
5 minuti
Categoria
AI, Business, Privacy Preserving

datafleets-federated-learning-data-science-machine-learning-ai-companies

DataFleets è una Federated Learning Platform, con un API per analisi con tutela della privacy, capace di unificare dati privati e distribuiti per un loro rapido e sicuro accesso.

Può essere pensata come il firewall tra gli utenti e i dati.

Invece di bloccare virus e minacce, garantisce con sicurezza matematica la privacy in ogni operazione.

Dall’estrazione alla creazione di modelli di machine learning, passando per la trasformazione e l’analisi di dati: tutto questo senza mai accedere direttamente ai singoli record di un dataset.

Per garantire questi standard così elevati, Datafleets fa uso delle più moderne tecniche di tutela della privacy: ecco quindi l’intersezione tra innovazione, analisi dati e crittografia.

Business Companies: Datafleets

Continua il nostro viaggio nell’analisi delle aziende che stanno innovando con soluzioni di privacy-preserving data science e machine learning.

L’obiettivo è quello di capire quali problemi stiano risolvendo, che prodotti offrano e chi siano i loro clienti, analizzando le tecnologie usate e i metodi di vendita, nonché la strategia comunicativa adottata.

Ricordi la foto scattata nella prima tapa di questo viaggio?

Esatto quella con Apheris AI, l’azienda che promette analisi sicure e precise su dataset distribuiti che ha concluso di recente un round d’investimenti da 2,5 milioni di euro.

Aspetta dov’è che era… Eccola qui!

Oggi non andiamo molto distanti, e vediamo una realtà con un grandissimo potenziale: Datafleets.

Il problema

Il più grande elemento comune di Data Science e Machine Learning è certamente la stretta dipendenza dai dati.

Quando questi sono pochi o di scarsa qualità, non importa quanto sofisticato possa essere il nostro algoritmo, difficilmente potremmo produrre un grande impatto.

La domanda allora diventa: come faccio ad avere accesso a molti dati di grande qualità?

Qui inizia l’annoso problema.

Ammesso, e non concesso, che siano stati raccolti propriamente, possiamo fidarci della loro bontà.

I dati ci sono, ma dove?

Speso capita però che siano sparsi, e aggregarli è la vera sfida.

Un sofisticato e complesso gioco, severamente regolamentato, che rende l’operazione a prima vista banale un vero calvario.

Com’è possibile allora che le aziende riescano a soddisfare severi requisiti garantendo al tempo stesso ottimi servizi?

La risposta è semplice: sul palco è tutto perfetto, ma nel dietro le quinte il caos incombe.

La verità è che la fuori, vuoi per complessità o negligenza, e per un pizzico d’ignoranza, poche sono le realtà davvero compliant, conformi alle norme di legge.

Dati che volano da un server Europeo a uno Nord Americano, una piccolissima svista di configurazione tanto semplice quanto selezionare il colore di un prodotto su Amazon, che potrebbero però costare alle aziende potenziali cause milionarie.

Be compliant

Ti faccio un esempio pratico.

Se avessi dati su un server Italiano, e ti trovassi negli Stati Uniti, oggi non potresti scaricare i dati sul tuo computer perché violeresti una legge europea.

Ancora peggio, se fossi un’azienda americana produttrice di un’applicazione e volessi renderla disponibile in uno stato europeo dovresti avere un server attivo all’interno dell’UE perché non potresti far comunicare l’app con quelli dell’HQ.

E una volta che i tuoi dati sono dall’altre parte del mondo e non puoi spostarli ne toccarli cosa fai, apri un ufficio a Parigi?

Economicamente insostenibile.

Da qualche mese ci sono migliaia di aziende con dati congelati

Esiste una soluzione a tutto questo?

La soluzione: DataFleets – Federated Intelligence Platform

La home page parla chiaro.

DataFleets è il partner perfetto per combinare e analizzare dati on-prem, in cloud, at the edge e ovunque risiedano.

Con un linguaggio più tecnico distinguiamo operazioni di:

  • In-Silo Intelligence
  • Cross-Silo Intelligence
  • Edge Intelligence

Le prime permettono di svolgere analisi senza spostare virtualmente i dati sensibili tra unità all’interno della stessa azienda, controllando con precisione e granularità gli accessi.

Le seconde consentono ai Data Scientist di creare una federazione cross-silo (e.g. Multi aziendale, tra banche e compagnie assicurative) senza preoccuparsi di dove risiedano i dati.

Infine, con le operazioni di Edge Intelligence possiamo creare modelli di Machine Learning che apprendano da on edge devices (i.e. IoT, App Mobile, etc.), senza tuttavia avere accesso diretto ai dati, con l’ausilio del Federated Learning.

DataFleets Product

Il loro prodotto è dunque una piattaforma web, cloud agnostic (i.e. capace di lavorare con Azure, AWS e GCP), che consente di eseguire su Custom Notebooks queries e calcoli su sorgenti remote, con una visualizzazione ricca e opzioni di governance.

Possiamo quindi usare python e le librerie di Tensorflow e Keras avendo la certezza che tutto sia eseguito in modo sicuro e tutelando la privacy.

Privacy Technology

Abbiamo esaminato in passato alcune delle tecnologie impiegate da DataFleets per offrire i suoi servizi.

La suite di privacy features impiegate include:

  • Differential Privacy
  • Secure Multi-Party Computation
  • Role Based Access Control (Controllare finemente gli accessi al livello API)
  • Gradient Clipping (Aggiornare i parametri di un modello prelevando casulamente dati da fonti diverse)
  • Data Locality (Permettere di eseguire query su dati remoti)
  • Comprehensive Compliance Features (Un insieme di strumenti e Dashboard per verificare la tutela della privacy)

DataFleets Sales

Realizzare un prodotto è solamente il primo passo.

Il secondo, altrettanto rilevante e delicato, è la vendita.

L’approccio oggi usato è quello definito di Challenger Sales, che ha rimpiazzato il meno efficace Solution Selling.

Ok, esploriamo insieme questi due micro mondi.

Il Challenger Sale è un metodo utile per la vendita di prodotti complessi ad altre aziende, efficace dunque nel business B2B.

Alcuni dei principali beneifici sono:

  • Stretta collaborazione tra reparto vendite e marketing, poiché qualora le due parti non dialogassero il successo sarebbe impossibile.
  • Permette di cogliere le giuste opportunità.
  • Enfatizza il valore laddove più rilevante per i clienti.

Il Challenger Sale Model guida una vendita in cui il venditore insegna attivamente al potenziale cliente, personalizza il processo di vendita e mantiene il controllo della conversazione.

Secondo questo modello chiunque, sviluppando le giuste capacità, può diventare un Challenger.

Per maggiori informazioni ti esorto comunque a leggere questo valido approfondimento.

Il Solution Selling guida invece la vendita con un focus sul problema risolto, anziché sul prodotto in sé, evidenziando specifici vantaggi che sarebbe possibile ottenere adottando la soluzione proposta.

DataFleets Advisors

Quando si lavora in un ambiente così tecnicamente avanzato e burocraticamente complicato, occorre circondarsi di esperti.

DataFleet ha un team di advsisors che comprende:

  • Andrew Trask, ricercatore e fondatore di OpenMined
  • Marty Chavez, Chief Information Officer (CIO) di Goldman Sachs
  • Ian Wilson, Former Head of AI presso HSBC
  • Rob Metcalf, Former President e Chied Operative Officer (COO) di Digital Reasoning

Per il momento è tutto.

Per aspera, ad astra

Un cado abbraccio, Andrea.

Taggedbusinessdifferential privacymachine learningprivacyprivacy preserving machine learning


Ultimi post

Patricia Merkle Trie

Il Practical Algorithm To Retrieve Information Coded In Alphanumeric Merkle Trie, o Patricia Merkle Trie è una struttura dati chiave-valore usatada Ethereum e particolarmente efficiente per il salvataggio e la verifica dell’integrità dell’informazione. In questo post ne studieremo le caratteristiche. Prima di procedere, ci conviene ripassare l’introduzione al Merkle Tree nella quale abbiamo chiarito il […]

Andrea Provino
ethereum-patricia-merkle-tree
Tree Data Structure: cos’è un Merkle Tree

Un Merkle Tree è una struttura dati efficiente per verificare che un dato appartenga a un insieme esteso di elementi. È comunemente impiegato nelle Peer to Peer network in cui la generazione efficiente di prove (proof) contribuisce alla scalabilità della rete. Capire i vantaggi di questa struttura ci tornerà utile nel nostro percorso di esplorazione […]

Andrea Provino
merkle-tree-cover
UTXO: come funziona il modello Unspent Transaction Outputs

Per tenere traccia dei bilanci utente, la blockchain di Bitcoin sfrutta un modello di contabilità definito UTXO o Unspent Transaction Outputs. In questo articolo ne esaminiamo le caratteristiche. Ogni blockchain è dotata di un sistema di contabilità, un meccanismo attraverso cui tenere traccia dei bilanci di ciascun utente. I due grandi modelli di riferimento nel […]

Andrea Provino
bitcoin-utxo
Cos’è Ethereum

Possiamo definire Ethereum come una macchina a stati distribuita che traccia le transizioni di un archivio dati general-purpose (i.e. una memoria in grado di registrare qualsiasi dato esprimibile come coppia di chiave e valore o key-value) all’interno della Ethereum Blockchain. È arrivato il momento di esplorare uno dei progetti tecnologici più innovativi e interessanti degli […]

Andrea Provino
ethereum