Meme Vision: la scienza della classificazione dei memi

Blog

Come persona di cultura e scienza, ho deciso di costruire un modello per identificare i memi. Questo problema è molto più semplice del Image-Net concorrenza e quindi una soluzione più semplice è appropriata. Lo dimostrerò confrontando il framework Meme Vision con ResNet-50 (il vincitore di Image-Net 2015).



Metodo: framework Meme Vision

In un precedente articolo ho spiegato il metodo dell'istogramma radiale;

float div uno accanto all'altro

Istogrammi di colore radiale

Quando il colore, la composizione e il calcolo sono tutti importanti per il tuo problema di visione artificiale, riduci radialmente la rappresentazione...



versodatascience.com

(TL;DR — misura la distribuzione del colore in ogni segmento dell'immagine)



Di seguito vediamo come questo può ridurre le immagini a rappresentazioni dimensionali molto basse.

Immagine per il post

Esempio di istogramma di colore radiale di base con 3 bin per canale di colore e 4 segmenti (che fornisce 4*3³=108 caratteristiche)

Il modello finale di Meme Vision utilizza alcuni passaggi aggiuntivi:

supporto tensorflow macchina vettoriale
  • Converti da RGB a HSV - Il degrado del colore è meno problematico per i computer se visualizzato nella tavolozza HSV.
  • Trasformazione del registro dei conteggi dei pixel per aiutare a concentrarsi sulle piccole differenze.
  • Usa 8 bin per canale (invece di 3) per distinguere sfumature di colore simili, che risultano 2048 caratteristiche (invece di 108).
  • Inserisci queste caratteristiche in un lineare supporto vettore macchina .

#riconoscimento di immagini #ottimizzazione #reti-neurali #memi #classificatore di immagini #reti neurali

versodatascience.com

Meme Vision: la scienza della classificazione dei memi

Il riconoscimento delle immagini non richiede sempre reti neurali; efficienza e precisione sono ottenibili con modelli più semplici. Come persona di cultura e scienza, ho deciso di costruire un modello per identificare i memi.