Cos’è U-Net? U-Net è una Fully Convolutional Network (FCN) sviluppata per applicazioni in campo medico: l’individuazione di tumori nei polmoni e nel cervello attraverso l’Image Segmentation. Com’è fatta una U’Net? In sintesi, l’architettura di una U-Net è costiuita da: Un encoder che riduce (down-sample) l’immagine in ingresso in una feature map, attraverso pooling layers, estraendone […]
Una FCN o Fully Convolutional Network è una deep neural network (rete neurale profonda) che supera le limitazioni delle convenzionali CNN eliminando il dense layer in favore di 1×1 convolutional layers. Abbiamo studiato insieme il funzionamento delle reti CNN, e sappiamo che per quanto avanzate siano sono comunque limitate. Le Convolutional Neural Networks sono infatti […]
Cos’è l’Image segmentation? La segmentazione di immagini è il processo applicato alle immagini per la classificazione di ogni pixel in una specifica classe, o label. Ecco a te un semplice esempio. Consideriamo un’immagine con due Ferrari verde, sullo sfondo delle autunnali colline toscane. La segmentazione semantica classificherà allora ogni pixel di entrambe le auto come […]
Questa guida ti aiuterà a configurare i file necessari per ottenere una segmentazione semantica a partire da una qualunque immagine, grazie ad una tecnica di machine learning applicata a foto: tensorflow in aiuto ed ecco la computer vision. Ometto dettagli circa la procedura perché suppongo che se ti trovi a leggere queste parole, hai già […]
Buongiorno! Sono le 5:21, e benché sia sveglio da ben 20 minuti ho passato il tempo a guardare su Imagenet la lista dei dataset di annotation (file xml) per i corrispettivi dataset di immagini. E’ un file html lungo quanto schifoso, esteticamente parlando… sono solo link… coooomunque, passiamo alla sfida di oggi. Sto anche pensando […]
Il progetto sulla carta sembra semplice: inquadri una serie di monete, e un algoritmo calcola la somma del denaro. Ora complichiamo il tutto. In base alle nostre ridotte conoscenze: dobbiamo creare un modello, ed effettuare il training. occorre raccogliere quante più immagini possibili di monete, in diverso stato, da diverse angolazioni. il nostro è un […]