Gli algoritmi che spiano il nostro umore
Molte persone sono convinte che il 2020 sia il peggior anno di sempre. In apparenza può sembrare una definizione irrimediabilmente soggettiva, ma almeno secondo uno strumento è corretta.
Lo strumento in questione è l’edonometro, un sistema informatizzato per valutare la nostra felicità e la nostra disperazione. L’edonometro lavora notte e giorno sui computer dell’università del Vermont (Uvm), dove analizza circa cinquanta milioni di tweet al giorno per effettuare una lettura rapida dell’umore dell’opinione pubblica. Secondo l’edonometro il 2020 è di gran lunga l’anno peggiore dal 2008, ovvero da quando sono raccolti i dati (all’inizio di marzo è stato raggiunto un record negativo, coincidente con l’esplosione della pandemia di covid-19. Il record è stato stracciato a maggio, dopo l’assassinio di George Floyd).
L’edonometro è uno strumento relativamente recente in un campo in cui ormai da cinquant’anni gli informatici cercano di valutare lo stato emotivo del mondo usando i computer. Per costruirlo, l’informatico dell’Uvm Chris Danforth ha dovuto insegnare a una macchina a capire le emozioni dietro i tweet analizzati (nessun essere umano potrebbe mai leggerli tutti). Questo processo, chiamato analisi del sentimento, ha fatto grandi progressi negli ultimi anni, trovando molteplici applicazioni.
Felicità incommensurabile
Oltre a rilevare la temperatura emotiva degli utenti di Twitter, i ricercatori studiano l’analisi dei sentimenti per valutare l’andamento dell’opinione pubblica sul cambiamento climatico e per verificare alcune idee molto radicate, per esempio quella secondo cui un accordo minore è più triste di un accordo maggiore (e in quale misura). Le aziende interessate all’umore dei consumatori stanno usando l’analisi dei sentimenti per valutare le recensioni su piattaforme come Yelp. Altre stanno anche misurando lo stato emotivo dei loro dipendenti raccogliendo dati sui social network interni. Questa tecnica potrebbe avere applicazioni in campo medico, per esempio identificando le persone affette da depressione e bisognose d’aiuto.
Secondo Danforth l’analisi dei sentimenti permette ai ricercatori di esaminare una massa enorme di dati che in passato era difficile raccogliere e impossibile studiare. “Nelle scienze sociali tendiamo a misurare elementi semplici, come il prodotto interno lordo. La felicità è un elemento importante che tuttavia è molto difficile da misurare”.
Il computer conta il numero di parole positive e sottrae il numero di parole negative. Ma ci sono dei problemi
Qualcuno potrebbe pensare che il primo passo nell’analisi dei sentimenti sia quello di insegnare al computer a capire ciò che gli umani scrivono. Ma gli informatici non sono in grado di farlo. La comprensione del linguaggio è uno dei problemi più complessi nel campo dell’intelligenza artificiale. Tuttavia, all’interno di un testo scritto, esistono segnali emotivi abbondanti che i computer possono riconoscere anche senza capire il significato delle parole.
Il primo approccio dell’analisi dei sentimenti è basato sul conteggio delle parole. Si tratta di un’idea piuttosto semplice: il computer conta il numero di parole positive e sottrae il numero di parole negative. Una misura migliore può essere ottenuta soppesando le parole: il termine “eccellente”, per esempio, veicola un sentimento più intenso rispetto a “buono”. Il peso delle parole è solitamente stabilito da esperti in carne e ossa, e ha un ruolo nella creazione dei dizionari lexicon, quelli che traducono le parole in emoticon (e viceversa) e sono molto usati nell’analisi dei sentimenti.
Ma il conteggio delle parole presenta alcuni problemi. Per esempio ignora l’ordine delle parole, trattando una frase come come una sorta di minestra di termini diversi scollegati tra loro. Considerate questa recensione: “Sono felice che il mio iPhone non abbia niente del mio vecchio e orribile telefono Android”. La frase contiene tre parole negative (niente, vecchio, orribile) e solo una positiva (felice). Un occhio umano riconosce subito che in questo caso vecchio e orribile si riferiscono a un telefono diverso, ma per il computer sembra un giudizio negativo. Il confronto presenta ulteriori difficoltà: cosa significa “non abbia niente”? Significa che il recensore non sta paragonando l’iPhone con il telefono Android? Il linguaggio umano, a volte, può essere molto astruso.
Per risolvere questi problemi gli informatici hanno creato approcci sempre più sofisticati, in modo da escludere il fattore umano dall’analisi. Oggi usano gli algoritmi dell’apprendimento per insegnare a un programma come riconoscere i rapporti tra le parole. Per esempio il computer può imparare che le parole letto e fiume spesso si presentano in relazione l’una con l’altra. Queste associazioni possono offrire indizi sul significato o sul sentimento di fondo di una frase. Se letto si trova nella stessa frase di notte, probabilmente ha un significato diverso.
Far bollire l’oceano
Un passo avanti molto importante in questo settore è arrivato nel 2013, quando Tomas Mikolov di Google Brain ha usato l’apprendimento automatico per convertire ogni parola in una serie di 50-300 numeri, chiamata vettore. I vettori sono come impronte digitali che descrivono una data parola e anche le altre parole che tendono a comparire insieme a essa.
Per ottenere questi vettori, il programma di Mikolov ha analizzato milioni di parole contenute negli articoli di giornale, cercando di prevedere la parola successiva in base a quella che la precedeva. Gli incastri di Mikolov riconoscono i sinonimi: parole come denaro e contante hanno vettori simili. In modo più sottile, gli incastri colgono le analogie elementari – il re è per la regina quello che il ragazzo è per la ragazza, per esempio – anche se non possono definire le parole. È un risultato notevole, considerando che queste analogie facevano parte della valutazione degli esami di ammissione all’università.
Gli incastri di Mikolov sono generati da una rete neurale dotata di un unico livello nascosto. Le reti neurali, modellate grosso modo sul cervello umano, hanno permesso di ottenere grandi progressi nell’apprendimento delle macchine, come dimostra il caso di AlphaGo (un software che ha imparato a giocare una partita di Go meglio del campione mondiale). La rete di Mikolov era deliberatamente poco profonda, in modo da prestarsi a diverse applicazioni, come la traduzione e l’analisi degli argomenti.
Le reti neurali più profonde, con più strati di “corteccia”, possono estrarre da una parola un numero maggiore di informazioni nel contesto di una frase o di un documento specifici. Un compito molto comune è quello di fare analizzare al computer una recensione di un film sull’Internet movie database e chiedergli di prevedere se alla fine il recensore metterà il pollice “giù” o “su”. I primi metodi basati sui lexicon ottenevano risultati accurati circa nel 74 per cento dei casi. I più sofisticati raggiungono l’87 per cento. Le prime reti neurali, create nel 2011, sono arrivate all’89 per cento. Oggi superano il 94 per cento e si avvicinano ai risultati degli esseri umani (l’umorismo e il sarcasmo restano ostacoli difficili da superare, perché le parole scritte possono indicare il sentimento diametralmente opposto a quello espresso dall’autore).
L’analisi dei sentimenti affonda le sue radici nella psicologia
Nonostante i vantaggi delle reti neurali, il metodo basato sui lexicon è ancora piuttosto popolare. L’edonometro, per esempio, utilizza un lexicon, e Danforth non ha alcuna intenzione di cambiare approccio. Anche se le reti neurali possono rivelarsi più accurate, infatti, comportano un costo. Il periodo di formazione rappresenta uno dei processi computazionali più complessi per un computer.
“In sostanza sei vincolato all’elettricità di cui disponi”, spiega Robert Stine, della Wharton school. Stine si è occupato dell’evoluzione dell’analisi del sentimento nell’Annual review of statistics and its application del 2019. “Quanta elettricità ha usato Google per formare AlphaGo? Qualcuno sostiene che fosse sufficiente per far bollire l’oceano”, racconta Stine.
Oltre alla corrente elettrica, le reti neurali hanno bisogno di strumentazioni molto costose e di una grande quantità di competenze tecniche. Inoltre bisogna tenere presente la mancanza di trasparenza, perché il computer tende a trovare il modo di completare la mansione assegnata anziché seguire le istruzioni esplicite del programmatore. “Con i lexicon è molto più facile rimediare agli errori”, conferma Bing Liu, dell’università dell’Illinois di Chicago, uno dei pionieri dell’analisi del sentimento.
Misurare la salute mentale
Pur ricadendo nel campo dell’informatica, l’analisi dei sentimenti affonda le sue radici nella psicologia. Nel 1962 lo psicologo di Harvard Philip Stone ha sviluppato General inquirer, il primo programma computerizzato di analisi del testo nel campo della psicologia. Negli anni novanta lo psicologo sociale James Pennebaker ha creato un programma d’avanguardia per l’analisi dei sentimenti (il Linguistic inquiry and word count) nel tentativo di analizzare l’universo psicologico degli esseri umani. Queste prime valutazioni hanno rivelato e confermato tendenze che gli esperti avevano osservato da tempo: i pazienti affetti da depressione avevano uno stile di scrittura distintivo, con una presenza maggiore del pronome “io”. Inoltre usavano più parole con un’accezione negativa, spesso riferite alla morte.
Oggi i ricercatori stanno analizzando l’espressione dello stato mentale nella scrittura e nel discorso analizzando gli interventi sui social network. Danforth e lo psicologo di Harvard Andrew Reece, per esempio, hanno esaminato i tweet di persone a cui successivamente è stato diagnosticato un disturbo depressivo o una sindrome da stress post traumatico (con il consenso dei partecipanti). I segnali della depressione comparivano in tweet scritti fino a nove mesi prima della diagnosi. Attualmente Facebook utilizza un algoritmo capace di identificare gli utenti che sembrano a rischio di suicidio. Una squadra esamina i casi segnalati e decide se invitare gli utenti a rivolgersi all’assistenza specializzata.
Dopo cinque anni di aumento delle temperature gli utenti di Facebook non si preoccupavano più per un’ondata di caldo
Ma siamo ancora lontani dal momento in cui i dati rilevati sui social network saranno utilizzati nell’assistenza sanitaria. I problemi legati alla privacy sono un ostacolo ovvio. Inoltre bisognerà lavorare ancora molto per dimostrare l’utilità di queste analisi. Diversi studi sulla valutazione dello stato mentale non riescono a definire in modo appropriato i propri termini o non forniscono informazioni sufficienti per replicare i risultati, spiega Stevie Chancellor, esperta presso l’università Northwestern di rapporti tra l’informatica e l’essere umano e coautrice di una recente analisi su 75 studi di questo tipo. Chancellor, in ogni caso, è convinta che l’analisi dei sentimenti possa essere utile in campo clinico, per esempio nel triage dei nuovi pazienti. Anche senza dati personali, l’analisi dei sentimenti può identificare tendenze come i livelli generali di stress degli studenti universitari durante una pandemia, o i tipi di interazione sui social network che possono spingere verso una ricaduta le persone affette da disturbi alimentari.
Leggere i sentimenti
L’analisi dei sentimenti si occupa anche di problematiche più leggere, come gli effetti del clima sull’umore. Nel 2016 Nick Obradovich, oggi dipendente dell’Istituto per lo sviluppo umano di Berlino, ha analizzato due miliardi di interventi su Facebook e un miliardo di tweet, scoprendo che tre centimetri di pioggia provocavano una riduzione dell’1 per cento nella felicità espressa dagli utenti, una percentuale che raddoppiava in caso di temperature sotto zero. In uno studio successivo (e più demoralizzante) Obradovich e i suoi colleghi hanno analizzato i tweet per comprendere il sentimento degli utenti rispetto al cambiamento climatico, scoprendo che dopo cinque anni di aumento delle temperature il senso di “normalità” degli utenti era cambiato e non si preoccupavano più per un’ondata di caldo. Il senso di benessere, invece, era ancora alterato dal fenomeno. “È come l’aneddoto della rana messa a bollire”, sottolinea Obradovich. “È stata una delle scoperte empiriche più allarmanti che abbia mai fatto”.
Gli informatici hanno messo alla prova anche la reputazione del lunedì come giorno più triste della settimana. Secondo una prima analisi dei tweet attraverso l’edonometro di Danforth, nonostante la parola lunedì suscitasse le reazioni più negative tra quelle che indicano i giorni della settimana, in realtà le persone esprimevano emozioni più tristi il martedì. Venerdì e sabato, naturalmente, sono risultati i giorni più felici. Tuttavia questa tendenza settimanale è cambiata dopo le presidenziali del 2016. Probabilmente esiste ancora un impatto dei giorni della settimana, “ma è coperto da eventi che catturano la nostra attenzione e vengono discussi più degli aspetti basilari della vita”. Traduzione: su Twitter la politica non si ferma mai. “Ogni giorno della settimana può essere il più triste”, sottolinea Danforth.
Un’altra “verità” messa alla prova è quella secondo cui nel campo della musica gli accordi maggiori siano più allegri di quelli minori. Yong-Yeol Ahn, esperto di scienze sociali computazionali dell’università dell’Indiana, ha verificato questa convinzione analizzando il sentimento dei testi che accompagnavano ogni accordo di 123mila canzoni. Gli accordi maggiori, in effetti, erano associati a parole più felici, ottenendo un punteggio di 6,3 contro il 6,2 degli accordi minori (su una scala da 1 a 9). Questa differenza può sembrare minima, ma in realtà corrisponde alla metà della differenza di umore tra il Natale e una normale giornata lavorativa sull’edonometro. Ann ha confrontato anche i diversi generi musicali e ha scoperto che il rock degli anni sessanta è il più felice, mentre il più triste è l’heavy metal.
Senso degli affari
Il mondo degli affari si sta interessando sempre di più a questo strumento. L’analisi dei sentimenti è ormai ampiamente utilizzata dalle aziende, ma molte non ne parlano, dunque è difficile valutarne la popolarità. “Lo fanno tutti: Microsoft, Google, Amazon, tutti. Alcuni hanno diversi gruppi di ricerca”, spiega Liu. Una misurazione accessibile di questo interesse è l’enorme numero di programmi commerciali e accademici disponibili. Uno studio del 2018 ne ha elencati 28.
Alcune aziende usano l’analisi dei sentimenti per valutare i messaggi pubblicati dai clienti sui social network. Un esempio (possibilmente apocrifo) è quello di Expedia Canada, che nel 2013 ha condotto una campagna di marketing diventata virale per il motivo sbagliato: la gente odiava il suono stridulo del violino in sottofondo. Expedia ha sostituito rapidamente lo spot con nuovi video che prendevano in giro il precedente, per esempio invitando un utente di Twitter infuriato a distruggere il violino. Molti sostengono che Expedia abbia scoperto le critiche sui social network grazie all’analisi dei sentimenti. Per quanto sia difficile confermarlo, è evidente che si tratta esattamente del tipo di sentimento che è possibile rilevare.
Altre aziende usano l’analisi dei sentimenti per valutare il gradimento dei dipendenti, per esempio monitorando i social network interni. Ibm, per esempio, ha sviluppato un programma chiamato Social Pulse che monitora l’intranet dell’azienda per individuare le rimostranze dei dipendenti. Per ragioni legate alla privacy il software analizza solo gli interventi condivisi con l’azienda. Ciononostante questa tendenza preoccupa Danforth. “Penso che la privacy dei dipendenti contrasti con gli obiettivi dell’azienda. È una manovra poco etica”.
Con la diffusione sempre maggiore dell’analisi dei sentimenti è probabile che l’etica continuerà a rappresentare un problema. Le aziende, i professionisti della salute mentale e altri settori che ne dovessero valutare l’uso non devono dimenticare che l’analisi dei sentimenti, per quanto promettente, non è una scienza esatta. L’aspetto matematico è relativamente semplice. Comprendere gli esseri umani lo è molto meno. “Al momento non comprendiamo nemmeno cosa sia la comprensione”, ammette Liu.
(Traduzione di Andrea Sparacino)
Questo articolo è uscito su Knowable.