Discorsi di potere e intelligenza artificiale

di Francesca Cristiano e Emiliano GiovannettiILC “Antonio Zampolli”, CNR

Il potere è una forza e, al tempo stesso, un effetto che circola in una rete di interazioni sociali; esso prende forma nei rapporti tra individui, gruppi e istituzioni, e trova espressione attraverso diverse modalità e in molteplici luoghi. In quanto esseri umani che vivono e interagiscono in una data società, siamo continuamente immersi in relazioni di potere. Uno dei mezzi attraverso i quali il potere si esercita e si riproduce è il linguaggio. Le parole non sono meri veicoli di informazione e descrizione della realtà, ma strumenti che contribuiscono a definirla all’interno di cornici che non sono mai neutre. In questo contesto si colloca l’Analisi Critica del Discorso (d’ora in avanti, per brevità, ACD), che considera il discorso come una forma di pratica sociale, la quale contribuisce al mantenimento o alla sovversione delle relazioni di potere. Questa ricerca analitica evidenzia come il discorso non sia mai neutro ma inglobi interessi, poteri e ideologie, rendendo visibile ciò che è implicito, naturalizzato e nascosto. Il discorso non è, quindi, solo un prodotto della società ma anche un potente strumento che contribuisce alla sua definizione. L’ACD dedica particolare attenzione ai linguaggi utilizzati dai media, considerati quali agenti attivi nella costruzione delle visioni del mondo, e strumenti in grado di influenzare credo, attitudini e comportamenti collettivi. I media sono mezzi di costruzione e disseminazione di significati, essi rappresentano contesti all’interno dei quali insiemi di simboli si consumano e diffondono. Nel campo dei media considerati “tradizionali”, le news assumono un ruolo molto peculiare. Queste ultime non sono solo una narrazione dei fatti, ma una particolare ricostruzione della realtà basata su norme e valori specifici di una data società. Di conseguenza, il linguaggio usato nel discorso delle news non è mai neutrale, al contrario, esso riflette ideologie socialmente condivise che non sono personali, ma sociali, istituzionali o politiche. Nel corso dei recenti anni, diversi strumenti computazionali sono stati adottati per automatizzare l’ACD, tuttavia, sollevando diverse difficoltà. Sebbene le tecnologie rendano possibile l’analisi di grandi volumi di testo, l’ACD resta profondamente legata a una comprensione contestuale e interpretativa del linguaggio. Una delle principali difficoltà riguarda la complessità semantica: le parole cambiano significato a seconda della loro posizione, del registro e dell’interazione con gli altri elementi del testo. A questo si aggiunge il problema della gestione del contesto, poiché molti significati ideologicamente rilevanti emergono solo all’interno di strutture discorsive ampie o in relazione a eventi e riferimenti culturali condivisi. Infine, le implicature — ovvero quei significati suggeriti ma non esplicitamente formulati — rappresentano un ostacolo significativo per i modelli computazionali, che spesso faticano a distinguere tra ciò che viene detto e ciò che viene intenzionalmente implicato. Queste difficoltà mostrano come l’automazione dell’ACD non debba essere intesa come una sostituzione dell’analisi umana, ma piuttosto come un supporto metodologico capace di ampliare le capacità esplorative e di offrire punti di accesso alla lettura critica dei testi.

Il lavoro qui descritto, condotto presso l’Istituto di Linguistica Computazionale del CNR in collaborazione con Fondazione Rut, costituisce un esperimento pilota volto a valutare le capacità dell’intelligenza artificiale generativa, attraverso i modelli linguistici di grandi dimensioni (Large Language Models, LLM), di supportare l’ACD applicata a un corpus giornalistico. Lo studio ha proposto un quadro di riferimento per valutare questi strumenti all’interno di un contesto specifico: quello di un evento altamente mediatizzato e controverso quale è stato l’attacco del 7 ottobre 2023, in cui la presenza di narrazioni ideologiche divergenti rende particolarmente rilevante la decostruzione critica del discorso. Al fine di raccogliere materiali politicamente e ideologicamente differenti, sono state selezionate tre testate giornalistiche, ovvero: The Jerusalem Post, The Electronic Intifada, e The Washington Post. Per ogni testata sono stati individuati 10 articoli, tutti appartenenti alla sezione “opinion”, in quanto essi riflettono in maniera esplicita l’orientamento politico e ideologico degli autori, e implicitamente anche quello della rivista stessa. Gli articoli sono stati selezionati attraverso parole chiave pertinenti e, in seguito, verificati manualmente. Il focus sugli attacchi del 7 Ottobre 2023 ha permesso di analizzare le rappresentazioni mediatiche divergenti di questo evento, che simboleggia un momento cruciale nel conflitto israelo-palestinese. Dopo aver individuato gli articoli da analizzare, è stato elaborato un set di 8 domande basate sui principi dell’ACD e, in particolare, sul quadro teorico di Teun A. van Dijk. Van Dijk esamina il discorso come un prodotto linguistico, e come una pratica sociale mediata socialmente e cognitivamente, la quale riflette e modella le relazioni di potere di un dato gruppo sociale. Inoltre, secondo la sua teoria il testo è organizzato in tre livelli, che sono interdipendenti e si supportano a vicenda. Questi tre livelli sono noti come macrostruttura, superstruttura e microstruttura. La macrostruttura riguarda il significato globale del testo, la superstruttura l’organizzazione complessiva del discorso, e la microstruttura gli elementi linguistici locali. Le domande che sono state formulate mirano a identificare le strategie discorsive e le rappresentazioni ideologiche presenti nei testi analizzati, attraverso un’analisi fondata sui tre livelli proposti da van Dijk. Le domande che rientrano nella categoria della macrostruttura hanno analizzato lo spazio dedicato alla descrizione degli eventi del 7 Ottobre, la valutazione connotativa dell’attacco, e l’identificazione degli attori principali quali agenti o target dell’azione. Una sola domanda è stata posta in relazione alla superstruttura e per indagare la funzione specifica del titolo, che può essere informativa, persuasiva o emotiva. Infine, le domande sulla microstruttura hanno esaminato i termini negativamente connotati che rinforzano una narrativa specifica, gli eufemismi usati per attenuare la violenza degli eventi e la deumanizzazione linguistica di un dato gruppo.

Due esempi di domande, corredate dalle possibili opzioni di risposta fornite ai valutatori umani e all’intelligenza artificiale, sono riportate di seguito nel box.

Le domande sono state somministrate a tre valutatori umani, e contemporaneamente, al LLM. Nello specifico, è stato utilizzato il modello GPT-4o, interrogato attraverso l’interfaccia ChatGPT. Poiché le risposte del modello possono talvolta variare, ciascuna domanda gli è stata posta per cinque volte. Le risposte fornite dal modello sono state, poi, confrontate con quelle date dai tre valutatori umani. Queste ultime sono state armonizzate attraverso il consenso e verificate tramite misure di accordo tra i valutatori, costituendo così lo standard di riferimento rispetto al quale è stata calcolata l’accuratezza del modello. Nel grafico a barre in figura si riportano le otto domande utilizzate nell’esperimento e l’accuratezza ottenuta per ognuna di esse. In particolare, l’accuratezza è stata calcolata sulla base di quanto il modello abbia fornito risposte conformi a quelle prodotte dai valutatori umani ed espressa con un valore da 0 a 1. I risultati di questo esperimento hanno mostrato come i modelli linguistici possano offrire un supporto concreto all’analisi critica del discorso, pur senza sostituirne la dimensione interpretativa. In particolare, l’intelligenza artificiale si è rivelata efficace nell’individuare elementi discorsivi più evidenti, come i temi principali di un testo, l’orientamento valutativo rispetto a un evento o il ruolo attribuito ai diversi attori coinvolti. Questi aspetti, che strutturano il discorso a un livello più generale, sono risultati più facilmente riconoscibili anche da strumenti automatici. Il risultato migliore, in termini di accuratezza, è stato registrato per la domanda 5, che analizza lo scopo del titolo e che è stata riportata nel box precedente. Al contrario, l’analisi di fenomeni più sottili e impliciti, come l’uso di eufemismi o le strategie di deumanizzazione, ha evidenziato limiti significativi. Il risultato peggiore, in termini di accuratezza, è stato registrato per la domanda 7 che indaga gli eufemismi, riportata nel box precedente. È emerso, ad esempio, che il modello ha faticato a distinguere tra formulazioni attenuanti e descrizioni esplicite della violenza, arrivando talvolta a considerare espressioni fortemente connotate come “mass slaughter”, “crushing Hamas” o “carnage” alla stregua di eufemismi. Nel complesso, questi risultati suggeriscono una direzione chiara: l’intelligenza artificiale può costituire una lente utile per esplorare grandi quantità di testi, individuare ricorrenze e sollevare interrogativi, ma, almeno per adesso, resta uno strumento che necessita di uno sguardo critico umano. In questo senso, il suo utilizzo consapevole non indebolisce l’analisi critica del discorso, ma può contribuire a rendere più visibili le strutture linguistiche attraverso cui il potere si è manifestato, si è legittimato e si è riprodotto nel linguaggio.

Condividi su:

arrow_upward