Blog.

Multioutput, Multiclass e Multilabel Classification


Autore
Andrea Provino
Data
Tempo di lettura
2 minuti
Categoria
Data Science, machine-learning

multilabel-classification-system-multiclass-classification-system-multioutput-classificastion-system-machine-learning-data-science-guida-italiano-con-esempi

Un multilabel classification system e un multioutput classification system sono sistemi con un livello di complessità superiore. Dobbiamo avere prima chiari i concetti base.

Un classificatore binario (binary classifier) gestisce egregiamente due classi. Quando il loro numero aumenta, passiamo a un classificatore mutliclasse (multiclass classifier), o usiamo degli escamotage.

Questa tipologia di classificatori muove però dall’assunzione che ogni istanza è associata a una e una sola classe.

Quindi un frutto può essere una banana, o una mela, ma non tutti e due allo stesso tempo, poiché siamo fuori dal regno della meccanica quantistica e il principio di non contraddizione del buon Aristotele domina sovrano.

Cosa succede quando la realtà non è codificabile in questi due sistemi?

Multilabel Classification System

Un multilabel classifier produce multiple label binarie per ogni specifica classe. Un sistem simile è particolarmente utile nelle immagini, per l’identificazione dei volti.

Così un’immagine contiene i volti di Andrea, Chiara e Roberta [1,1,1], ma una seconda solo quelli di Andrea e Chiara [1,1,0]. Le classi sono tre e ogni istanza può allo stesso tempo avere più di una classe.

Un estratto di testo tratta di religione, politica e finanza ma non di tecnologia [1,1,1,0], mentre un altro solo di finanza e tencologia [0,0,1,1].

Generalmente la libreria Scikit-Learn gestisce questo sistema di classificatori attribuendo un ugual peso a ciascuna label. Spesso potrebbe capitare di voler aggirare questo comportamento specificando un peso, proporzionale al support, ossia le il numero complessivo d’istanze con quella particolare label.

Code da ricordare?

average="weighted"

Peraltro un multiclass classification system può essere convertito in un multilabel classification system.

Considera che esistono granchi di sesso maschile o femminili con esoscheletro blu o arancione.

Un multiclass classification system avrà 4 possibili classi e una sola classe finale

  • male-blue,
  • male-orange,
  • female-blue
  • female-orange

Mentre un multilabel classification system avrà 2 label possibili e 2 classi contemporanemaente:

  • male / female
  • orange / blue

Multioutput Classification System

Un multioutput-multiclass classification system, o multioutput classification è una generalizzazione del multilabel classification quando le classi per ciascuna label sono più di due (mutliclass label).

Un caldo abbraccio, Andrea.

Taggeddata scienceteoria


Ultimi post

Patricia Merkle Trie

Il Practical Algorithm To Retrieve Information Coded In Alphanumeric Merkle Trie, o Patricia Merkle Trie è una struttura dati chiave-valore usatada Ethereum e particolarmente efficiente per il salvataggio e la verifica dell’integrità dell’informazione. In questo post ne studieremo le caratteristiche. Prima di procedere, ci conviene ripassare l’introduzione al Merkle Tree nella quale abbiamo chiarito il […]

Andrea Provino
ethereum-patricia-merkle-tree
Tree Data Structure: cos’è un Merkle Tree

Un Merkle Tree è una struttura dati efficiente per verificare che un dato appartenga a un insieme esteso di elementi. È comunemente impiegato nelle Peer to Peer network in cui la generazione efficiente di prove (proof) contribuisce alla scalabilità della rete. Capire i vantaggi di questa struttura ci tornerà utile nel nostro percorso di esplorazione […]

Andrea Provino
merkle-tree-cover
UTXO: come funziona il modello Unspent Transaction Outputs

Per tenere traccia dei bilanci utente, la blockchain di Bitcoin sfrutta un modello di contabilità definito UTXO o Unspent Transaction Outputs. In questo articolo ne esaminiamo le caratteristiche. Ogni blockchain è dotata di un sistema di contabilità, un meccanismo attraverso cui tenere traccia dei bilanci di ciascun utente. I due grandi modelli di riferimento nel […]

Andrea Provino
bitcoin-utxo
Cos’è Ethereum

Possiamo definire Ethereum come una macchina a stati distribuita che traccia le transizioni di un archivio dati general-purpose (i.e. una memoria in grado di registrare qualsiasi dato esprimibile come coppia di chiave e valore o key-value) all’interno della Ethereum Blockchain. È arrivato il momento di esplorare uno dei progetti tecnologici più innovativi e interessanti degli […]

Andrea Provino
ethereum