Revisione: modelli ricorsivi profondi per la composizionalità semantica su un albero di sentimenti

Blog

Questo articolo è una breve rassegna del documento di ricerca ( Socher et al., 2013 ) in cui gli autori hanno proposto un approccio efficiente e innovativo che si concentra sulla struttura grammaticale di una frase per un'analisi del sentimento a grana fine.

L'articolo discute vari metodi compositivi per combinare parole e frasi (n-gram) per prevedere i sentimenti binari (positivi o negativi) e a grana fine (molto positivi, positivi, neutri, negativi, molto negativi) di parole, frasi e intera frase in modo dal basso verso l'alto. Il contributo principale di questo articolo è quello di introdurre un set di dati basato su albero di analisi con etichette sentiment a grana fine: Stanford Sentiment Treebank e propone un modello compositivo neurale: Recursive Neural Tensor Network (RNTN) che supera tutti i precedenti modelli ricorsivi e raggiunge lo stato di performance d'arte.

Set di dati: Stanford Sentiment Treebank

Il set di dati è stato creato analizzando 11 855 frasi di un corpus di estratti di recensioni di film con Stanford Parser, ottenendo 215.154 frasi che sono state poi campionate in modo casuale ed etichettate in 25 valori (Figura 1) utilizzando Amazon Mechanical Turk. Si osserva che frasi più brevi hanno sentimenti neutri mentre sentimenti più polarizzati vengono notati in frasi più lunghe. Inoltre è stato osservato sulla base della classificazione degli annotatori su una scala di scorrimento, una classificazione di 5 classi è sufficiente per catturare le principali variabili.

Il set di dati treebank facilita la creazione di modelli efficienti in grado di prevedere la polarità di frasi brevi e classificare esempi di negazione difficili che non erano ottenibili con i precedenti approcci bag-of-words che ignorano l'ordine delle parole in una frase. Anche l'accuratezza della classificazione binaria (positiva o negativa) sull'attività di analisi del sentiment ha superato l'80% per la prima volta dopo l'introduzione di treebank.

#review #sentiment-analysis #rntn #mv-rnn #data-analysis

medium.com

Revisione: modelli ricorsivi profondi per la composizionalità semantica su un albero di sentimenti

Il contributo principale di questo articolo è quello di introdurre un set di dati basato su albero di analisi con etichette sentiment a grana fine: Stanford Sentiment Treebank e propone un modello compositivo neurale: Recursive Neural Tensor Network (RNTN) che supera tutti i precedenti modelli ricorsivi e raggiunge lo stato di performance d'arte.